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Konzept für eine Datenvermehrung von Trainingsdatensätzen für ein Maschinenlern- 


Modell zur Vorhersage eines Zustands eines technischen Bauteils 


Technisches Gebiet 


Die vorliegende Erfindung bezieht sich auf Verfahren, Vorrichtungen und Computerprogram- 
men zum Erzeugen von Trainingsdatensätzen zum Trainieren eines Maschinenlern-Modells 
zur Vorhersage über einen Zustand eines technischen Bauteils, zum Trainieren eines solchen 


Maschinenlern-Modells, und zum Einsatz eines solchen Maschinenlern-Modells. 


Hintergrund 


Der vermehrte Einbau von Messtechnik zum Monitoring energietechnischer Anlagen und Be- 
triebsmitteln führt zu großen Mengen an Normalzustandsmessungen und der gelegentlichen 
Erfassung von Fehlerzuständen. Diese Normal- und Fehlerzustandsmessungen ermöglichen 
den Einsatz von Diagnoseverfahren, die auf Supervised Machine Learning (ML), deutsch 
„Überwachtes maschinelles Lernen“ basieren. Der Erfolgsgrad dieser ML-Diagnosesysteme 
ist abhängig von der Qualität und Quantität der zur Verfügung stehenden Daten. Elektrische 
Betriebsmittel weisen allerdings eine hohe Zuverlässigkeit auf, sodass nur sehr wenige Daten 
von Fehlerzuständen zur Erstellung von Diagnosesystemen zur Verfügung stehen. Somit kann 
nicht das vollständige Potential der ML-Diagnosesysteme ausgeschöpft werden. Eine Mög- 
lichkeit, ML-Diagnosesysteme zu verbessern, ist der Verwendung von Datenvermehrungs- 
methoden (auch engl. „Data Augmentation“). Diese generieren synthetische Daten zur Ver- 
größerung des Trainingsdatensatzes. Bisherige Datenvermehrungsmethoden sind zumeist ge- 
nerische Methoden. Diese integrieren kein Wissen über die nachfolgende Diagnoseaufgabe 


in die synthetischen Daten. 


Mit einer modellbasierten Datenvermehrung wurden in der Medizintechnik bereits erfolg- 
reich synthetische Bilder für das Training von Maschinenlern-Modellen generiert, da nicht 
genügend Trainingsdaten zur Verfügung standen. Von Shugiong Wu (Wu etal.: „Reconstruc- 
ting 3D Lung Shape from a Single 2D Image during the Deaeration Deformation Process 
using Model-based Data Augmentation“ (2019)) wurde ein sogenanntes Convolutional Neu- 
ral Network (Konvolutionelles Neuronales Netzwerk, CNN) trainiert, um aus 2D-Lungenbil- 


dern 3D-Lungenbilder zu erstellen. Dafür wurden Statistical Displacement Models 
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(Statistische Verdrängungsmodelle, SDMs) zur Erstellung von synthetischen 3D Lungenbil- 
dern verwendet. Es wurde dabei für jedes vorhandene Computertomographiebild ein SDM 
erzeugt. Anschließend konnten mit den Modellen 3D Lungenbildern erstellt werden, die einen 
unterschiedlichen Füllzustand der Lunge repräsentieren. Diese synthetischen Bilder werden 
anschließend zum Training der CNNs eingesetzt. Es wurde gezeigt, dass Einsatz der synthe- 


tischen Daten in der Maschinenlern-Modell-Erstellung den Prädiktionsfehler verringert. 


Ähnlich wird bei Uzunova et al. (Training CNNs for Image Registration from Few Samples 
with Model-based Data Augmentation“ (2017)) vorgegangen. Dort werden sogenannte „sta- 
tistical appearance models“ (statistische Erscheinungsbildmodelle) mit Bildern von medizi- 
nischen Bildern parametriert. Für die Aussehens- und Formparameterwerden Normalvertei- 
lungen angenommen. Durch Ziehen von Parametern aus den jeweiligen Normalverteilungen 
können neue Bilder erzeugt werden. Mit diesen Bildern können anschließend selbstlernende 


Verfahren trainiert werden. 


Diese beiden Ansätze befassen sich jedoch nur mit bildbezogenen Anwendungen im medizi- 
nischen Bereich. Teilweise müssen mehrere Modelle zur Datengenerierung erstellt werden, 
was einen erhöhten Aufwand bedeutet. Die vorgestellten Verfahren bieten keine Möglichkeit 
synthetischer Fehlerzustandsdaten zu erzeugen. Zudem ist nicht beschrieben, wie mit Model- 
len umzugehen ist, die Eingangsgrößen benötigen. Weiterhin werden die generierten, synthe- 
tischen Daten direkt für das Training verwendet, sodass sich mögliche Fehler der Modellie- 


rung im endgültig genutzten Maschinenlern-Modellen niederschlagen können. 


Zur Diagnose von Betriebsmitteln werden beispielsweise klassische Datenvermehrungsver- 
fahren wie das Aufmodulieren von weißem Rauschen oder Zeitdehnung oder -streckungen 
angewendet (Li etal.: „Intelligent rotating machinery fault diagnosis based on deep learning 
using data augmentation” (2020)). Eine Alternative zu diesen Datenvermehrungsverfahren 
bieten Deep-Learning-Methoden, die generative Modelle einsetzen. Diese generativen Mo- 
delle haben den Vorteil, von Merkmalen zu lernen mit diesem Wissen synthetische Daten zu 
generieren. In der Diagnostik von mechanischen Bauteilen (Li etal.: „Intelligent rotating ma- 
chinery fault diagnosis based on deep learning using data augmentation” (2020)) als auch bei 
der Detektion von Teilentladungen (Wu etal.: „Partial Discharge Data Augmentation of High 
Voltage Cables based on the Variable Noise Superposition and Generative Adversarial Net- 


work“ (2018)) werden mit selbstlernenden Datenvermehrungsverfahren verbesserte 
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Diagnoseergebnisse erreicht. Bei der Detektion von Heißpunkten in Schaltanlagen kann nur 
eine geringe Verbesserung mittels selbstlernender Datenvermehrungsverfahren nachgewie- 
sen werden (Gitzel et al.: „Towards Robust ML-Algorithms for the Condition Monitoring of 
Switchgear“ (2019)). Allerdings sind die dafür verwendeten Datenvermehrungsmethoden ge- 
nerische Methoden und bieten so nicht die Möglichkeit zusätzliches Wissen in Form von phy- 


sikalischen Modellen in die Datenvermehrung zu integrieren. 


Es besteht der Bedarf nach einem verbesserten Ansatz zur Vermehrung von Daten zum Trai- 
ning von Maschinenlern-Modellen und zum entsprechenden Training und Einsatz von Ma- 


schinenlern-Modellen. 


Zusammenfassung 


Diesem Bedarf wird von dem Gegenstand der unabhängigen Ansprüche Rechnung getragen. 


Ausführungsbeispiele der vorliegenden Offenbarung basieren auf der Erkenntnis, dass die 
Datenvermehrung dadurch verbessert werden kann, dass physikalische Modelle eines techni- 
schen Bauteils verwendet werden, um synthetische Daten zu erzeugen. Dabei ist ein physika- 
lisches Modell ein Modell, das physikalische Zusammenhänge des technischen Bauteils ab- 
bildet. Im Allgemeinen kann mittels dieses physikalischen Modells über einen Computer das 
technische Bauteil simuliert und/oder berechnet werden. Anstatt die synthetischen Daten di- 
rekt aus den vorhandenen Daten abzuleiten, werden vielmehr Eingangsdaten und Modell-Pa- 
rameterwerte des physikalischen Modells aus den Messdaten abgeleitet und genutzt, um syn- 
thetische Daten mit einer erhöhten Genauigkeit zu erzeugen. Beispielsweise wurden in der 
Energietechnik, und in anderen technischen Gebieten, physikalische Modelle von Betriebs- 
mitteln entwickelt. Diese in eine Datenvermehrung zu integrieren kann zu einer weiteren Ver- 
besserung von ML-Diagnosesystemen von energietechnischen Anlagen und Betriebsmitteln 
führen. Ausführungsbeispiele schaffen Verfahren, Vorrichtungen und Computerprogramme 
zum Erzeugen von Trainingsdatensätzen, zum Training eines Maschinenlern-Modells mittels 
solcher Trainingsdatensätze, und zum Einsatz eines solchen Maschinenlern-Modells, die auf 


diesen Erkenntnissen basieren. 


Verschiedene Aspekte der vorliegenden Offenbarung beziehen sich auf ein computer-imple- 


mentiertes Verfahren zum Erzeugen von Trainingsdatensätzen zum Trainieren eines 
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Maschinenlern-Modells zur Vorhersage über einen Zustand eines technischen Bauteils. Das 
Verfahren umfasst ein Erhalten einer Mehrzahl von Messdatensätzen über das technische 
Bauteil. Jeder Messdatensatz umfasst zumindest ein oder mehrere Ausgangs-Messdaten. Das 
Verfahren umfasst ferner ein Ermitteln von Modell-Parameterwerten von ein oder mehreren 
Modell-Parametern eines physikalischen Modells des technischen Bauteils basierend auf den 
ein oder mehreren Ausgangs-Messdaten der jeweiligen Messdatensätze. Das Verfahren um- 
fasst ferner ein Bestimmen einer ersten Mehrzahl von Trainingsdatensätzen. Beispielsweise 
kann das Verfahren ein Durchführen einer ersten Mehrzahl von Simulationen des physikali- 
schen Modells, um die erste Mehrzahl von Trainingsdatensätzen zu generieren. Basierend auf 
einer statistischen Verteilung der ermittelten Modell-Parameterwerte können ein oder meh- 
rere Modell-Parameterwerte für die jeweilige Simulation der ersten Mehrzahl von Simulatio- 
nen ausgewählt werden. Das Verfahren umfasst ferner ein Durchführen einer zweiten Mehr- 
zahl von Simulationen des physikalischen Modells, um eine zweite Mehrzahl von Trainings- 
datensätzen zu generieren. Basierend auf der statistischen Verteilung der ermittelten Modell- 
Parameterwerte werden ein oder mehrere Modell-Parameterwerte für die jeweilige Simula- 
tion ausgewählt. Für jede Simulation wird zumindest ein Modell-Parameterwert der Modell- 
Parameterwerte außerhalb eines Hauptbereichs der statistischen Verteilung der ermittelten 
Modell-Parameterwerte ausgewählt. Durch das Ermitteln der Modell-Parameterwerte kann 
das physikalische Modell genauer den Messdaten des Bauteils angeglichen werden, so dass 
die erzeugten Trainingsdaten den Messdaten ähnlicher werden. Durch die Auswahl zumindest 
eines Modell-Parameterwerts, der sich außerhalb des Hauptbereichs der statistischen Vertei- 
lung des oder der Modell-Parameterwerte liegt, kann oder können ein oder mehrere abnor- 
male Zustände des Bauteils simuliert werden, um Trainingsdatensätze zu erzeugen, die einen 
oder mehrere solcher abnormalen Zustände abbilden, die in den Messdaten selten vorkom- 
men. Hierdurch lässt sich eine Datenvermehrung durchführen, die Trainingsdaten erzeugt, die 
den Messdaten höchst ähnlich sind, und die insbesondere einen Mangel an Messdaten von 


abnormalen Zuständen ausgleichen können. 


Beispielsweise können die erste Mehrzahl von Trainingsdatensätzen einen Normalzustand 
des technischen Bauteils und die zweite Mehrzahl von Trainingsdatensätzen einen oder meh- 
rere abnormale Zustände des technischen Bauteils abbilden. In anderen Worten kann die 
zweite Mehrzahl von Simulationen durchgeführt werden, um gezielt Trainingsdatensätzen 


von abnormalen Zuständen des technischen Bauteils zu erzeugen. 
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Dabei kann das physikalische Modell dazu geeignet sein, um eine Simulation des Normalzu- 
stands und eine Simulation der ein oder mehreren abnormalen Zustände des Bauteils durch- 
zuführen. Somit muss nur ein physikalisches Modell gepflegt werden, auch kann die Ermitt- 
lung der Modell-Parameterwerte für den Normal- und die ein oder mehreren abnormalen Zu- 
stände verwendet werden. Alternativ kann eine erste Version des physikalischen Modells ge- 
nutzt werden, um die Simulation des Normalzustands und eine zweite Version des physikali- 
schen Modells genutzt werden, um die Simulation der ein oder mehreren abnormalen Zu- 
stände des Bauteils durchzuführen. In diesem Fall kann besser auf die Eigenheiten des tech- 
nischen Bauteils außerhalb des Normalzustands eingegangen werden und/oder das Modell für 


die Simulation des Normalzustands einfacher gestaltet werden. 


Während manche physikalische Modelle ohne Eingangs-Daten auskommen, etwa weil sie 
durch eine im Modell abgebildete Bewegung oder andere Größe angeregt werden, basieren 
viele physikalische Modelle nicht nur auf Modell-Parameterwerten, sondern auch auf Ein- 
gangs-Daten. In verschiedenen Ausführungsbeispielen umfasst die Mehrzahl von Messdaten- 
sätzen daher ferner ein oder mehrere Eingangs-Messdaten. In diesem Fall können die Modell- 
Parameterwerte des physikalischen Modells ferner basierend auf den ein oder mehreren Ein- 
gangs-Messdaten ermittelt werden. Für die Simulationen, etwa die erste und/oder die zweite 
Mehrzahl von Simulationen, des physikalischen Modells können ferner basierend auf einer 
statistischen Verteilung der Eingangs-Messdaten ein oder mehrere Eingangs-Daten ausge- 


wählt werden. 


Das Verfahren basiert auf der statistischen Verteilung der ermittelten Modell-Parameterwerte 
des physikalischen Modells. Entsprechend kann das Verfahren ferner das Bestimmen der sta- 
tistischen Verteilung der ermittelten Modell-Parameterwerte des physikalischen Modells um- 
fassen. Insbesondere kann das Verfahren ein Bestimmen der statistischen Verteilung der er- 
mittelten Modell-Parameterwerte des physikalischen Modells, durch Unterteilen der Mehr- 
zahl von Messdatensätzen in eine Mehrzahl von Gruppen von Messdatensätzen, Ermitteln, 
für jede Gruppe von Messdatensätzen, von ein oder mehreren Modell-Parameterwerten des 
physikalischen Modells durch Minimierung eines Fehlers zwischen den ein oder mehreren 
Ausgangs-Messdaten der jeweiligen Gruppe von Messdatensätzen und entsprechenden mit- 
tels des physikalischen Modells erzeugten Ausgangsdaten, und Berechnen der statistischen 
Verteilung der basierend auf den verschiedenen Gruppen von Messdatensätzen ermittelten 


Modell-Parameterwerte umfassen. So kann die statistische Verteilung der Modell- 
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Parameterwerte über eine Unterteilung der Messdatensätze zusammengestellt werden. Dabei 


kann jede Gruppe von Messdatensätzen ein oder mehrere Messdatensätze umfassen. 


In verschiedenen Ausführungsbeispielen kann der Hauptbereich der statistischen Verteilung 
der Modell-Parameterwerte basierend auf einer vorgegebenen Wahrscheinlichkeitsverteilung 
der Modell-Parameterwerte bestimmt werden, etwa basierend auf einer Normalverteilung 
oder einer Poisson-Verteilung der Modell-Parameterwerte. Entsprechend kann das Verfahren 
ein Bestimmen einer vorgegebenen Wahrscheinlichkeitsverteilung (etwa einer Normalvertei- 
lung oder einer Poisson-Verteilung) der Modell-Parameterwerte durch Fitting der statisti- 
schen Verteilung der ermittelten Modell-Parameterwerte auf die vorgegebenen Wahrschein- 


lichkeitsverteilung umfassen. 


Entsprechend kann die Auswahl der Modell-Parameterwerte außerhalb des Hauptbereichs 
ausgestaltet werden. Beispielsweise kann für jede Simulation der zweiten Mehrzahl von Si- 
mulationen zumindest ein Modell-Parameterwert basierend auf einer vorgegebenen Min- 
destabweichung von einem Erwartungswert einer Normalverteilung der Modell-Parameter- 
werte ausgewählt werden. Beispielsweise kann die vorgegebene Mindestabweichung zumin- 
dest 2,5 Standardabweichungen betragen. Über die Normalverteilung und eine vorgegebene 
Abweichung von der Normalverteilung lassen sich Bereiche berechnen, die außerhalb des 
Hauptbereichs der statistischen Verteilung der Modell-Parameterwerte liegen und die sich 


dadurch dafür eignen, um einen abnormalen Zustand des technischen Bauteils zu simulieren. 


Beispielsweise kann für jede Simulation der zweiten Mehrzahl von Simulationen ein Modell- 
Parameterwert außerhalb des Hauptbereichs der statistischen Verteilung der ermittelten Mo- 
dell-Parameterwerte und andere Modell-Parameterwerte, sofern vorhanden, basierend auf der 
statistischen Verteilung der ermittelten Modell-Parameterwerte ausgewählt werden. Weist 
das physikalische Modell mehrere Modell-Parameter auf, so können beispielsweise alle außer 


einem Modell-Parameter „normale“ Parameter-Werte annehmen. 


Alternativ oder zusätzlich können für zumindest eine Simulation der zweiten Mehrzahl von 
Simulationen zumindest zwei Modell-Parameterwerte außerhalb des Hauptbereichs der sta- 
tistischen Verteilung der jeweiligen Modell-Parameterwerte ausgewählt werden. Dabei kön- 
nen die zumindest zwei Modell-Parameterwerte basierend auf einem vorbekannten Zusam- 


menhang zwischen den zwei Modell-Parametern ausgewählt werden. Dies ermöglicht, mit 
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dem notwendigen Wissen, eine realistischere Modellierung von abnormalen Zuständen des 


technischen Bauteils. 


Im Allgemeinen können für jede Simulation der ersten Mehrzahl von Simulationen die ein 
oder mehreren Modell-Parameterwerte entsprechend der statistischen Verteilung der ermit- 
telten Modell-Parameterwerte ausgewählt werden. Diese bilden somit den Normalzustand des 


technischen Bauteils ab. 


Das physikalische Modell kann beispielsweise dazu vorgesehen sein, um durch Durchführen 
einer Simulation basierend auf zumindest ein oder mehreren Modell-Parameterwerten, und 
optional ein oder mehreren Eingangsdaten, ein oder mehrere Ausgangsdaten zu erzeugen. 
Dadurch kann das physikalische Modell zur Generierung der Trainingsdatensätze verwendet 


werden. 


Das Verfahren kann im Allgemeinen zur Erzeugung von Trainingsdaten zum Training von 
Maschinenlern-Modellen zur Vorhersage eines Zustands technischer Bauteile vieler Domä- 
nen verwendet werden, sofern für das jeweilige Bauteil ein physikalisches Modell ermittelt 
werden kann. Insbesondere kann das technische Bauteil eine Komponente einer Maschine 
oder einer technischen Anlage sein, etwa einer energietechnischen Anlage. In manchen Aus- 
führungsbeispielen kann das technische Bauteil etwa ein elektrotechnisches Bauteil sein, wie 
etwa eines von einem Transformator, einem Laststufenschalter, einem Leistungsschalter, ei- 
nem Trennschalter, einem Lasttrennschalter, einer Schaltanlage, einem Kabel, einer Muffe, 


einer Freileitung, einer Freileitungsarmatur und einer Hochspannungsdurchführung. 


Verschiedene Aspekte der vorliegenden Offenbarung befassen sich ferner mit einem compu- 
ter-implementierten Verfahren zum Trainieren eines Maschinenlern-Modells zur Vorhersage 
eines Zustands eines technischen Bauteils. Das Verfahren umfasst ein Erhalten einer ersten 
Mehrzahl von Trainingsdatensätzen und einer zweiten Mehrzahl von Trainingsdatensätzen. 
Die erste Mehrzahl von Trainingsdatensätzen und die zweite Mehrzahl von Trainingsdaten- 
sätzen sind basierend auf dem zuvor vorgestellten Verfahren erzeugt. Die erste Mehrzahl von 
Trainingsdatensätzen bilden einen Normalzustand des technischen Bauteils ab und die zweite 
Mehrzahl von Trainingsdatensätzen bilden einen oder mehrere abnormale Zustände des tech- 
nischen Bauteils ab. Das Verfahren umfasst ferner ein Trainieren des Maschinenlern-Modells 


basierend auf der ersten Mehrzahl von Trainingsdatensätzen und basierend auf der zweiten 
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Mehrzahl von Trainingsdatensätzen. Somit können die mittels des zuvor genannten Verfah- 
rens erzeugten Trainingsdatensätze verwendet werden, um ein entsprechendes Maschinen- 


lern-Modell zu trainieren. 


Das zuvor vorgestellte Verfahren zum Erzeugen von Trainingsdatensätzen wird im Allgemei- 
nen genutzt, um bereits vorhandene Messdaten um synthetische Trainingsdatensätze zu er- 
weitern, so dass eine größere Menge an Trainingsdatensätzen zum Training des Maschinen- 
lern-Modells zur Verfügung steht. Somit kann das Verfahren zum Trainieren des Maschinen- 
lern-Modells ferner ein Erhalten einer Mehrzahl von Messdatensätzen über das technische 
Bauteil umfassen. Dabei kann das Training des Maschinenlern-Modells ferner auf der Mehr- 
zahl von Messdatensätzen basieren. Somit kann das Maschinenlern-Modell sowohl auf den 
erzeugten, synthetischen Trainingsdatensätzen als auch auf den gemessenen Trainingsdaten- 


sätzen trainiert werden. 


Beispielsweise kann die Mehrzahl von Messdatensätzen um die erste und zweite Mehrzahl 
von Trainingsdatensätzen erweitert werden und das Maschinenlern-Modell gemeinsam basie- 
rend auf der Mehrzahl von Messdatensätzen und der ersten und zweiten Mehrzahl von Trai- 
ningsdatensätzen trainiert werden. Dies ermöglicht ein Training des Maschinenlern-Modells 


mit einem größeren Satz von Trainingsdaten. 


Alternativ kann das Maschinenlern-Modell in einem ersten Schritt basierend auf der ersten 
und zweiten Mehrzahl von Trainingsdatensätzen trainiert werden, und das Training des Ma- 
schinenlern-Modells in einem zweiten Schritt mittels Transfer Learning basierend auf der 
Mehrzahl von Messdatensätzen fortgeführt werden. Damit kann beispielsweise ein Fein-Tu- 
ning auf unterschiedliche Instanzen des technischen Bauteils oder auf unterschiedliche tech- 
nische Bauteile, die das gleiche physikalische Modell verwenden, ermöglicht werden. Dabei 
kann das vortrainierte Modell beispielsweise als „standalone feature extractor“ (selbstständi- 
ger Merkmals-Extrahierer), „integrated feature extractor“ (integrierter Merkmals-Extrahierer) 
oder für die Gewichts-Initialisierung verwendet werden, wie im Zusammenhang mit den Fign. 


2a bis 2h vertiefend dargestellt wird. 


Beispielsweise kann das Maschinenlern-Modell eine Mehrzahl von Schichten umfassen. Die 
Gewichte zumindest einer Schicht der Mehrzahl von Schichten kann während des Transfer 


Learning eingefroren sein. Damit ist es möglich, erst ein allgemeineres Modell zu generieren, 
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das anschließend basierend auf den Messdaten nachjustiert wird, da die relevanten Gewichte, 
die im Transfer Learning angepasst werden, im Allgemeinen in den Schichten, die näher zu 


einer Ausgabeschicht der Mehrzahl von Schichten angeordnet sind, zu finden sind. 


Im Allgemeinen kann das Maschinenlern-Modell mittels Supervised Learning trainiert wer- 
den. Dabei können die erste und zweite Mehrzahl von Trainingsdatensätzen als Eingabedaten 
und die Zugehörigkeit der Trainingsdatensätze zu einer der ersten und zweiten Mehrzahl von 
Trainingsdatensätzen als erwünschte Ausgabedaten für das Training verwendet werden. Bei- 
spielsweise kann die Zugehörigkeit zu den Trainingsdatensätzen als Zielwert für einen Klas- 


sifikator verwendet werden. 


In verschiedenen Ausführungsbeispielen wird das Maschinenlern-Modell als Klassifikator für 
den Zustand des technischen Bauteils trainiert. Beispielsweise kann das Maschinenlern-Mo- 
dell trainiert werden, um basierend auf einen Datensatz (oder mehreren Datensätzen) mit 
Messdaten den Zustand des technischen Bauteils in eine der Klassifikationen Normalzustand 
und Fehlerzustand einzuteilen. Alternativ kann das Maschinenlern-Modell trainiert werden, 
um basierend auf einen Datensatz (oder mehreren Datensätzen) mit Messdaten den Zustand 
des technischen Bauteils in eine der Klassifikationen Normalzustand, Vor-Fehlerzustand und 
Fehlerzustand einzuteilen. Alternativ kann das Maschinenlern-Modell trainiert werden, um 
basierend auf einen Datensatz (oder mehreren Datensätzen) mit Messdaten einen Zustand des 
technischen Bauteils in zumindest eine der Klassifikationen Normalzustand, erster Fehlerzu- 
stand und zweiter Fehlerzustand einzuteilen. Auch Mischformen sind möglich, etwa zur Klas- 
sifikation in die Klassen Normalzustand, ein oder mehrere abnormale Zustände (etwa Vor- 


Fehlerzustände) und ein oder mehrere Fehlerzustände. 


Verschiedene Aspekte der vorliegenden Offenbarung befassen sich ferner mit einem compu- 
ter-implementierten Verfahren zum Vorhersagen eines Zustands eines technischen Bauteils. 
Das Verfahren umfasst ein Erhalten eines Messdatensatzes über das technische Bauteil. Das 
Verfahren umfasst ein Bereitstellen von Messdaten des Messdatensatzes für ein Maschinen- 
lern-Modell, wobei das Maschinenlern-Modell gemäß dem zuvor genannten Verfahren trai- 
niert ist. Das Verfahren umfasst ferner ein Vorhersagen des Zustands des technischen Bauteils 
basierend auf einer Ausgabe des Maschinenlern-Modells. Dies stellt die Anwendung des Ma- 
schinenlern-Modells dar, das basierend auf der vorgestellten Datenvermehrung trainiert 


wurde. 
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Verschiedene Aspekte der vorliegenden Offenbarung befassen sich ferner mit einem System 
umfassend ein technisches Bauteil und eine computerimplementierte Vorrichtung. Die com- 
puterimplementierte Vorrichtung umfasst ein oder mehrere Prozessoren und ein oder mehre- 
ren Speichereinrichtungen und ist ausgebildet zum Ausführen des Verfahrens zum Vorhersa- 
gen eines Zustands eines technischen Bauteils. Dabei ist die computerimplementierte Vor- 


richtung ausgebildet, um den Zustand des technischen Bauteils vorherzugsagen. 


Verschiedene Aspekte der vorliegenden Offenbarung befassen sich ferner mit einem Pro- 
gramm mit einem Programmcode zum Durchführen zumindest eines der zuvor vorgestellten 
Verfahren, wenn der Programmcode auf einem Computer, einem Prozessor, einem Kontroll- 


modul oder einer programmierbaren Hardwarekomponente ausgeführt wird. 


Verschiedene Aspekte der vorliegenden Offenbarung befassen sich ferner mit einer compu- 
terimplementierten Vorrichtung mit ein oder mehreren Prozessoren und ein oder mehreren 
Speichereinrichtungen, ausgebildet zum Durchführen zumindest eines der vorgestellten Ver- 


fahren. 


Figurenkurzbeschreibung 


Einige Beispiele von Vorrichtungen und/oder Verfahren werden nachfolgend bezugnehmend 


auf die beiliegenden Figuren lediglich beispielhaft näher erläutert. Es zeigen: 


Fig. la ein Flussdiagramm eines Beispiels eines computer-implementierten Verfahrens 
zum Erzeugen von Trainingsdatensätzen zum Trainieren eines Maschinenlern-Mo- 


dells zur Vorhersage über einen Zustand eines technischen Bauteils; 


Fig. 1b ein Blockdiagramm eines Beispiels einer computer-implementierten Vorrichtung 
zum Erzeugen von Trainingsdatensätzen zum Trainieren eines Maschinenlern-Mo- 


dells zur Vorhersage über einen Zustand eines technischen Bauteils; 


Fig. lc ein schematisches Diagramm einer grundlegenden Verfahrensweise einer modell- 


basierten Datenvermehrung; 
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Fig. 1d 


Fig. le 


Fig. If 


Fig. 2a 


Fig. 2b 


ein schematisches Diagramm eines Beispiels zur Erzeugung von Trainingsdaten- 


sätzen, die einen Normalzustand eines technischen Bauteils abbilden; 


ein Diagramm einer Wahrscheinlichkeitsverteilung und einer basierend auf der 


Wahrscheinlichkeitsverteilung ausgeführten Auswahl eines Modell-Parameters; 


ein Diagramm eines Beispiels eines Ermittelns von Modell-Parameterwerten für 


ein physikalisches Modell eines Transformators; 


ein Flussdiagramm eines Beispiels eines computer-implementierten Verfahrens 
zum Trainieren eines Maschinenlern-Modells zur Vorhersage eines Zustands eines 


technischen Bauteils; 


ein Blockdiagramm eines Beispiels einer computer-implementierten Vorrichtung 
zum Trainieren eines Maschinenlern-Modells zur Vorhersage eines Zustands eines 


technischen Bauteils; 


Fign. 2c und 2d zwei Beispiele einer Vermischung von Messtrainingsdaten und synthetischen 


Fig. 2e 


Fig. 2f 


Fig. 2g 


Fig. 3a 


Fig. 3b 


Trainingsdaten; 


ein Beispiel eines Transfer Learning-Ansatzes; 


ein Beispiel eines Transfer Learning-Ansatzes, der auf einer Feineinstellung des 


Maschinenlern-Modells basiert; 


ein Beispiel eines Transfer Learning-Ansatzes, der auf einer Merkmalsextraktion 


basiert; 


ein Flussdiagramm eines Beispiels eines computer-implementierten Verfahrens 


zum Vorhersagen eines Zustands eines technischen Bauteils; und 


ein Blockdiagramm eines Beispiels einer computer-implementierten Vorrichtung 


zum Vorhersagen eines Zustands eines technischen Bauteils und eines Systems. 
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Beschreibung 
Einige Beispiele werden nun ausführlicher Bezug nehmend auf die beiliegenden Figuren be- 
schrieben. Weitere mögliche Beispiele sind jedoch nicht auf die Merkmale dieser detailliert 
beschriebenen Ausführungsformen beschränkt. Diese können Modifikationen der Merkmale 
sowie Entsprechungen und Alternativen zu den Merkmalen aufweisen. Ferner soll die Termi- 
nologie, die hierin zum Beschreiben bestimmter Beispiele verwendet wird, nicht einschrän- 


kend für weitere mögliche Beispiele sein. 


Gleiche oder ähnliche Bezugszeichen beziehen sich in der gesamten Beschreibung der Figu- 
ren auf gleiche oder ähnliche Elemente beziehungsweise Merkmale, die jeweils identisch oder 
auch in abgewandelter Form implementiert sein können, während sie die gleiche oder eine 
ähnliche Funktion bereitstellen. In den Figuren können ferner die Stärken von Linien, Schich- 


ten und/oder Bereichen zur Verdeutlichung übertrieben sein. 


Wenn zwei Elemente A und B unter Verwendung eines „oder“ kombiniert werden, ist dies so 
zu verstehen, dass alle möglichen Kombinationen offenbart sind, d. h. nur A, nur B sowie A 
und B, sofern nicht im Einzelfall ausdrücklich anders definiert. Als alternative Formulierung 
für die gleichen Kombinationen kann „zumindest eines von A und B“ oder „A und/oder B“ 


verwendet werden. Das gilt Äquivalent für Kombinationen von mehr als zwei Elementen. 


Wenn eine Singularform, z.B. „ein, eine“ und ‚der, die, das“ verwendet wird und die Ver- 
wendung nur eines einzelnen Elements weder explizit noch implizit als verpflichtend definiert 
ist, können weitere Beispiele auch mehrere Elemente verwenden, um die gleiche Funktion zu 
implementieren. Wenn eine Funktion im Folgenden als unter Verwendung mehrerer Elemente 
implementiert beschrieben ist, können weitere Beispiele die gleiche Funktion unter Verwen- 
dung eines einzelnen Elements oder einer einzelnen Verarbeitungsentität implementieren. Es 
versteht sich weiterhin, dass die Begriffe „umfasst“, „umfassend“, „aufweist“ und/oder „auf- 
weisend“ bei deren Gebrauch das Vorhandensein der angegebenen Merkmale, Ganzzahlen, 
Schritte, Operationen, Prozesse, Elemente, Komponenten und/oder einer Gruppe derselben 
beschreiben, dabei aber nicht das Vorhandensein oder das Hinzufügen eines oder mehrerer 
anderer Merkmale, Ganzzahlen, Schritte, Operationen, Prozesse, Elemente, Komponenten 


und/einer Gruppe derselben ausschließen. 
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Verschiedene Ausführungsbeispiele der vorliegenden Offenbarung befassen sich mit einer 
modellbasierten Datenvermehrung, die es erlaubt, Betriebsmittelmodelle, das heißt physika- 
lische Modelle eines Betriebsmittels, welches ein technisches Bauteil ist, in die Datenvermeh- 


rung zu integrieren. 


Fig. la zeigt ein Flussdiagramm eines Beispiels eines computer-implementierten Verfahrens 
zum Erzeugen von Trainingsdatensätzen zum Trainieren eines Maschinenlern-Modells zur 
Vorhersage über einen Zustand eines technischen Bauteils. Das Verfahren umfasst ein Erhal- 
ten 110 einer Mehrzahl von Messdatensätzen über das technische Bauteil. Jeder Messdaten- 
satz umfasst zumindest ein oder mehrere Ausgangs-Messdaten. Das Verfahren umfasst ferner 
ein Ermitteln 120 von Modell-Parameterwerten von ein oder mehreren Modell-Parametern 
eines physikalischen Modells des technischen Bauteils basierend auf den ein oder mehreren 
Ausgangs-Messdaten der jeweiligen Messdatensätze. Das Verfahren umfasst ferner ein Be- 
stimmen 140 einer ersten Mehrzahl von Trainingsdatensätzen. Beispielsweise kann das Ver- 
fahren ein (optionales) Durchführen einer ersten Mehrzahl von Simulationen des physikali- 
schen Modells, um die erste Mehrzahl von Trainingsdatensätzen zu generieren. Basierend auf 
einer statistischen Verteilung der ermittelten Modell-Parameterwerte können ein oder meh- 
rere Modell-Parameterwerte für die jeweilige Simulation der ersten Mehrzahl von Simulatio- 
nen ausgewählt werden. Alternativ oder zusätzlich können die Messdatensätze als erste Mehr- 
zahl von Trainingsdatensätzen verwendet werden. In diesem Fall sind die erste Mehrzahl von 
Trainingsdatensätze nicht synthetisch. Das Verfahren umfasst ferner ein Durchführen 150 ei- 
ner zweiten Mehrzahl von Simulationen des physikalischen Modells, um eine zweite Mehr- 
zahl von Trainingsdatensätzen zu generieren. Basierend auf der statistischen Verteilung der 
ermittelten Modell-Parameterwerte werden ein oder mehrere Modell-Parameterwerte für die 
jeweilige Simulation ausgewählt. Für jede Simulation wird zumindest ein Modell-Parameter- 
wert außerhalb eines Hauptbereichs der statistischen Verteilung der ermittelten Modell-Para- 
meterwerte ausgewählt. Optional umfasst das Verfahren ferner ein Bereitstellen (etwa ein 
Ausgeben) der ersten Mehrzahl und/oder der zweiten Mehrzahl von Trainingsdatensätzen, 


etwa über eine Schnittstelle oder über eine Speichereinrichtung. 


Fig. 1b zeigt ein Blockdiagramm eines Beispiels einer entsprechenden computer-implemen- 
tierten Vorrichtung zum Erzeugen von Trainingsdatensätzen zum Trainieren eines Maschi- 
nenlern-Modells zur Vorhersage über einen Zustand eines technischen Bauteils. Die Vorrich- 


tung 10 umfasst ein oder mehreren Prozessoren 14 und ein oder mehreren 
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Speichereinrichtungen 16. Optional umfasst die Vorrichtung 10 ferner eine Schnittstelle 12. 
Die Vorrichtung 10 ist ausgebildet zum Durchführen zumindest des Verfahrens von Fig. la. 
Optional kann die Vorrichtung 10 ferner ausgebildet sein, um das Verfahren von Fig. 2a 
und/oder das Verfahren von Fig. 3a auszuführen. Dabei wird die Funktionalität der Vorrich- 
tung 10 von den ein oder mehreren Prozessoren 14 der Vorrichtung bereitgestellt, unter Zu- 
hilfenahme der optionalen Schnittstelle 12 (etwa zum Erhalten der Messdatensätze und zur 
Ausgabe der Trainingsdatensätze) und der ein oder mehreren Speichereinrichtungen (etwa 
zum Speichern der Messdatensätze, der Trainingsdatensätze und des physikalischen Mo- 


dells). 


Die folgende Beschreibung bezieht sich sowohl auf das Verfahren von Fig. la als auch auf 
ein entsprechendes Computerprogramm und die entsprechende Vorrichtung von Fig. 1b. 
Merkmale, die im Zusammenhang des Verfahrens eingeführt werden, können daher auch in 
die entsprechende Vorrichtung und das Computerprogramm übernommen werden (und um- 


gekehrt). 


Die grundlegende Vorgehensweise eines Beispiels der modellbasierten Datenvermehrung, 
wie sie durch das vorgeschlagene Verfahren, das entsprechende Computerprogramm und die 
entsprechende Vorrichtung durchgeführt werden, ist in Abbildung Ic dargestellt. Fig. Ic zeigt 
ein schematisches Diagramm einer grundlegenden Verfahrensweise einer modellbasierten 


Datenvermehrung. 


Die modellbasierte Datenvermehrung basiert auf drei Kernbausteinen: einem Modell des Be- 
triebsmittels (d.h. des technischen Bauteils), einem Algorithmus zum Ermitteln der Modell- 
Parameterwerte des physikalischen Modells (etwa zur Parameteroptimierung des Modells) 
und der Generierung von Parameterkombinationen des Modells. Durch das Modell kann zu- 
sätzliches Wissen über die zu diagnostizierende Komponente und Messgrößenzusammen- 
hänge integriert werden. Mit dem Algorithmus zum Ermitteln der Modell-Parameterwerte 
kann das Modell an Messdaten gefittet werden, um so den Fehler zwischen Modellausgang 
und Messdatensätzen zu minimieren. Mit diesem Algorithmus und den vorhandenen Messun- 
gen wird beispielsweise eine Datenbank der Parameter des Modells erstellt, indem das Modell 
mehrfach an unterschiedliche Messungen gefittet wird. Wie in Fig. lc gezeigt wird, werden 
Messungen, d.h. Messdatensätze, als Eingabe der Parameteroptimierung des physikalischen 


Modells genutzt. Dabei sind die Bezeichnungen „Optimierung“ und „Minimierung“ nicht 
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absolut zu verstehen — Ziel ist es, die Werte im Rahmen einer Optimierung zu verbessern und 
nicht zwangsläufig den einen optimalen Wert zu ermitteln. Auch ist es Ziel, den Fehler im 
Rahmen einer Minimierung zu reduzieren; dabei ist es nicht zwangsläufig das Ziel, den einen 


minimalen Wert zu ermitteln. 


Aus dieser Parameterdatenbank generiert ein weiterer Algorithmus (,Parametrierungsalgo- 
rithmus“ in Fig. Ic) Parameterkombinationen für die erste und zweite Mehrzahl von Simula- 
tionen, also für Normal- und abnormale Zustände, wie etwa Fehlerzustände. Mit diesen Para- 
metern wird das Modell parametriert und im Rahmen der ersten und zweiten Mehrzahl von 
Simulationen simuliert. Somit können synthetische Daten, etwa die erste und zweite Mehrzahl 
von Trainingsdatensätzen, erzeugt werden. Welche Modell-Parameter, ob alle oder eine Teil- 
menge verwendet wird, kann vom Anwender festgelegt werden. Darüber hinaus wurden Mög- 
lichkeiten entwickelt, wie die synthetischen Daten der modellbasierten Datenvermehrung für 
die Erstellung von Maschinenlern-Modellen verwendet werden können, was im Zusammen- 


hang mit den Fign. 2a bis 2g erläutert wird. 


Physikalische Modelle stellen Systeme in der Regel vereinfacht dar und vernachlässigen da- 
bei einige interne oder externe Einflüsse wie z. B. Temperatureinflüsse. Infolgedessen zeigen 
Messungen des realen Systems eine Streuung, die durch das physikalische Modell nicht dar- 
gestellt wird. Die modellbasierte Datenvermehrung bildet diese Streuung ab, da sie für die 
korrekte Unterscheidung zwischen Abnormal- und Normalzustand notwendig ist. Die mo- 
dellbasierte Datenvermehrung verwendet eine wahrscheinlichkeitsbasierte Parameterauswahl 
des physikalischen Modells, um die in den Messungen gefundenen Streuungen darzustellen. 
Abnormal- oder Fehlerzustände werden dabei durch Manipulation der Wahrscheinlichkeits- 


verteilungen der ausgewählten Parameter simuliert. 


Zur Erstellung der dafür benötigten statistischen Verteilung der Modell-Parameterwerte, und, 
optional, einer statistischen Verteilung von Eingangsdaten des physikalischen Modells, wer- 
den die Messdatensätze ausgewertet. Dabei umfasst jeder Messdatensatz zumindest ein oder 
mehrere Ausgangs-Messdaten. Optional umfasst die Mehrzahl von Messdatensätzen ferner 
ein oder mehrere Eingangs-Messdaten. Dabei sind die Messdatensätze, wie dem Namen zu 
entnehmen ist, Datensätze, die auf Messungen (im Folgenden auch Observationen genannt) 
basieren. Dabei ist eine Vielzahl von verschiedenen Messdaten denkbar. Beispielsweise kön- 


nen die Messdaten (d.h. die Eingangs-Messdaten und/oder die Ausgangsmessdaten) ein oder 
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mehrere von Messdaten eines Stromsensors, Messdaten eines Spannungssensors, Messdaten 
eines Audio-Sensors (etwa eines Analog-Digital-Wandlers, der ein Mikrofonsignal wandelt), 
Messdaten eines Vibrations-Sensors, Messdaten (etwa Bilddaten) einer Kamera (etwa einer 
Wärmebildkamera), Messdaten eines Temperatursensors, Messdaten eines Wettersensors, 
Messdaten eines Drehzahlsensors und Messdaten eines Kraftsensors umfassen. Die Messda- 
ten können dabei vorverarbeitet sein, d.h., Filter können auf die Messdaten angewandt sein 
und/oder eine mathematische Transformation kann auf die Messdaten angewandt sein. Bei- 
spielsweise können bei einer Vibrationsmessung Vibrationen einer bestimmten Frequenz iso- 
liert sein und die jeweiligen Messdaten bilden. Dabei entsprechen die Ausgangs-Messdaten 
Messdaten, die an einem Ausgang des technischen Bauteils gemessen werden oder die eine 
Beobachtung über das technische Bauteil darstellen, etwa eine Bewegung des technischen 
Bauteils oder ein Stromverbrauch des technischen Bauteils. Die Eingangs-Messdaten entspre- 
chen Messdaten von Mitteln dar, die einen Einfluss auf das technische Bauteil nehmen. Im 
Falle des im Rahmen von Fig. 1g behandelten Transformators können die Ausgangs-Messda- 
ten beispielsweise der Schwingungsamplitude A,oonz entsprechen, die durch einen Audio- 
Sensor oder einen Vibrationssensor gemessen werden kann, während die Eingangs-Messda- 
ten beispielsweise dem Strom i und der Spannung u entsprechen können. Diese Messdaten 
der Messdatensätze werden verwendet, um die Modell-Parameterwerte des physikalischen 
Modells zu ermitteln, d.h., die generischen Modell-Parameterwerte des physikalischen Mo- 
dells zu anzupassen, dass sie möglichst genau ein entsprechendes technisches Bauteil abbil- 
den, an dem die Messdaten gewonnen wurden. Dabei bilden die Mehrzahl von Messdatensät- 
zen beispielsweise einen Normalzustand des technischen Bauteils ab, so dass auf dieser Basis 
sowohl Trainingsdatensätze, die den Normalzustand abbilden als auch Trainingsdatensätze, 


die einen abnormalen Zustand abbilden, gewonnen werden können. 


Das Verfahren umfasst daher das Ermitteln 120 der Modell-Parameterwerte der ein oder meh- 
reren Modell-Parameter des physikalischen Modells des technischen Bauteils basierend auf 
den ein oder mehreren Ausgangs-Messdaten der jeweiligen Messdatensätze, und optional ba- 
sierend auf den ein oder mehreren Eingangs-Messdaten ermittelt. Dies kann beispielsweise 
durch Lösen eines Gleichungssystems des physikalischen Modells, basierend auf den Aus- 
gangs-Messdaten und optional den Eingangs-Messdaten geschehen. Dabei ist es das Ziel, die 
Modell-Parameterwerte so zu wählen, dass Ausgangsdaten des physikalischen Modells mög- 
lichst genau den Ausgangs-Messdaten der Messdatensätzen entsprechen (etwa wenn das phy- 


sikalische Modell mit den entsprechenden Eingangs-Messdaten als Eingangsdaten simuliert 
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wird). In anderen Worten werden die Modell-Parameterwerte so gewählt, dass der Fehler 
zwischen den Ausgangsdaten des physikalischen Modells und den Ausgangsmessdaten redu- 
ziert/minimiert werden. Beispielsweise kann das physikalische Modell in einer numerischen 
Simulation berechnet werden, oder, wenn das physikalischen Modell einer Formel entspricht, 


die die physikalischen Zusammenhänge abbildet, kann die Formel berechnet werden. 


In dem vorgeschlagenen Konzept basiert die Parametrierung aufeiner statistischen Verteilung 
der Modell-Parameterwerte des physikalischen Modells. Entsprechend kann das Verfahren 
ein Bestimmen 122 der statistischen Verteilung der ermittelten Modell-Parameterwerte des 
physikalischen Modells umfassen. Insofern kann beispielsweise nicht nur ein Modell-Para- 
meterwert oder ein Satz von Modell-Parameterwerten ermittelt werden. Vielmehr können, 
basierend auf der Mehrzahl von Messdatensätzen, eine Mehrzahl verschiedener Modell-Pa- 
rameterwerte oder verschiedener Sätze von Modell-Parameterwerten ermittelt werden. Da- 
raufhin kann eine statistische Auswertung basierend auf der Mehrzahl verschiedener Modell- 
Parameterwerte oder verschiedener Sätze von Modell-Parameterwerten durchgeführt werden. 
Das Bestimmen 122 der statistischen Verteilung der ermittelten Modell-Parameterwerte des 
physikalischen Modells kann daher, beispielsweise, durch Unterteilen 124 der Mehrzahl von 
Messdatensätzen in eine Mehrzahl von Gruppen von Messdatensätzen, Ermitteln 120, für jede 
Gruppe von Messdatensätzen, von ein oder mehreren Modell-Parameterwerten des physika- 
lischen Modells durch Minimierung des Fehlers zwischen den ein oder mehreren Ausgangs- 
Messdaten der jeweiligen Gruppe von Messdatensätzen und entsprechenden mittels des phy- 
sikalischen Modells erzeugten Ausgangsdaten, und Berechnen 126 der statistischen Vertei- 
lung der basierend auf den verschiedenen Gruppen von Messdatensätzen ermittelten Modell- 
Parameterwerte durchgeführt werden. Dabei kann jede Gruppe von Messdatensätzen ein oder 


mehrere Messdatensätze umfassen. 


In manchen Beispielen kann die statistische Verteilung der Modell-Parameterwerte, etwa für 
die zweite Mehrzahl von Simulationen, in eine vorgegebene Wahrscheinlichkeitsverteilung 
überführt werden, etwa in eine Normalverteilung oder eine Poissonverteilung. Entsprechend 
kann das Verfahren ein Bestimmen einer 128 vorgegebenen Wahrscheinlichkeitsverteilung 
der Modell-Parameterwerte, etwa einer Normalverteilung oder einer Poissonverteilung der 
Modell-Parameterwerte, durch Fitting der statistischen Verteilung der ermittelten Modell-Pa- 


rameterwerte auf die vorgegebenen Wahrscheinlichkeitsverteilung umfassen. 


10 


15 


20 


25 


30 


FHG21015DE 18 


Basiert das physikalische Modell auf Eingangsdaten, die im Rahmen der Simulationen als 
Parameter übergeben werden, so kann auch die statistische Verteilung der entsprechenden 
Eingangs-Messdaten ermittelt werden. Beispielsweise kann das Verfahren ferner ein Bestim- 
men 130 der statistischen Verteilung der Eingangs-Messdaten umfassen. Wiederum kann für 
die Eingangs-Messdaten eine vorgegebene Wahrscheinlichkeitsverteilung verwendet werden, 
etwa Normalverteilungen, multivariate Normalverteilungen, Chi-Quadrat-Verteilungen, Be- 
taverteilungen, Dreiecksverteilungen usw. Das Verfahren kann daher ferner ein Fitting der 
statistischen Verteilung der Eingangs-Messdaten auf eine vorgegebene Wahrscheinlichkeits- 


verteilung umfassen. 


Die Datenvermehrung des Normalzustandsdaten basiert auf dem Modell des zu diagnostizie- 
renden Systems (d.h. dem physikalischen Modell), einem Algorithmus zur Modell-Paramete- 
ridentifikation anhand von Messungen und einer Parameterwerteziehung. Das Verfahren um- 
fasst das Durchführen 140 der ersten Mehrzahl von Simulationen des physikalischen Modells, 
um die erste Mehrzahl von Trainingsdatensätzen zu generieren. Dabei ist das physikalische 
Modell dazu vorgesehen ist, um durch Durchführen einer Simulation basierend auf zumindest 
ein oder mehreren Modell-Parameterwerten, und, optional, ein oder mehreren Eingabedaten, 
ein oder mehrere Ausgangsdaten zu erzeugen. Dabei kann das physikalische Modell dazu 
geeignet sein, um eine Simulation des Normalzustands (d.h. die erste Mehrzahl von Simula- 
tionen) und eine Simulation der ein oder mehreren abnormalen Zustände (d.h. die zweite 
Mehrzahl von Simulationen) des Bauteils durchzuführen. Alternativ kann eine erste Version 
des physikalischen Modells für die erste Mehrzahl von Simulationen und eine zweite Version 
des physikalischen Modells, die von der ersten Version verschieden ist, für die zweite Mehr- 
zahl von Simulationen verwendet werden. Das Durchführen der Simulationen (der ersten und 
zweiten Mehrzahl von Simulationen) kann durch Durchführen einer numerischen Simulation 
oder durch Berechnen einer Formel erfolgen, die die physikalischen Zusammenhänge abbil- 


det. 


Basierend auf der statistischen Verteilung der ermittelten Modell-Parameterwerte (die jeweils 
auf eine vorgegebene Wahrscheinlichkeitsverteilung gefittet sein können, wie etwa Normal- 
verteilungen, multivariate Normalverteilungen, Chi-Quadrat-Verteilungen, Betaverteilungen, 
Dreiecksverteilungen) werden ein oder mehrere Modell-Parameterwerte für die jeweilige Si- 
mulation ausgewählt. Optional werden, sofern in dem physikalischen Modell vorgesehen, fer- 


ner basierend auf der statistischen Verteilung der Eingangs-Messdaten ein oder mehrere 
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Eingangs-Daten ausgewählt. In anderen Worten kann das Verfahren ferner ein Auswählen 
der ein oder mehrere Modell-Parameterwerte, und, optional, der ein oder mehreren Eingangs- 
Parameter, für die jeweilige Simulation umfassen. Dabei kann für jede Simulation der ersten 
Mehrzahl von Simulationen die ein oder mehreren Modell-Parameterwerte, und, optional, die 
ein oder mehreren Eingangsdaten, entsprechend der statistischen Verteilung der ermittelten 
Modell-Parameterwerte oder der statistischen Verteilung der Eingangs-Messdaten ausge- 
wählt werden. Dabei werden die Modell-Parameterwerte, und optional, Eingangsdaten des 
physikalischen Modells, basierend auf dem Algorithmus zur Modell-Parameteridentifikation 


anhand von Messungen (wie bereits eingeführt) und der Parameterwerteziehung ausgewählt. 


Fig. 1d zeigt ein schematisches Diagramm eines Beispiels zur Erzeugung von Trainingsda- 
tensätzen, die einen Normalzustand eines technischen Bauteils abbilden. Für die Simulation 
des Modells aus Fig. Id werden sowohl Eingangsgrößen als auch Modell-Parameterwerte 
verwendet. Beide werden in bei der modellbasierten Datenvermehrung des Normalzustands 
über eine statistische Ziehung ermittelt. Dafür werden die Wahrscheinlichkeitsverteilungen 
(d.h. die statistischen Verteilungen) der Eingangsgrößen und Parameterwerte des Modells er- 


mittelt. Der Ablauf der Erzeugung synthetischer Normalzustandsdaten ist in Fig. 1d gezeigt. 


Es sind n Stichprobenmessungen (d.h. Messdatensätze oder Observationen) des Normalzu- 
stands vorhanden, die für die Datenvermehrung genutzt werden. Aus den Messungen kann 
für jede Eingangsgröße jeweils eine Wahrscheinlichkeitsverteilung identifiziert werden 
(Block „Identifikation der Eingangsgrößenverteilungen“ mit zwei exemplarischen Eingangs- 
größenwerten E, und E,). Für die Identifikation der Wahrscheinlichkeitsverteilungen der Pa- 
rameterwerte des Modells (Block „Multiple Parametrierung des physikalischen Modells“) 
werden die vorhandenen n Messungen (d.h. die Mehrzahl von Messdatensätzen) in q Teile 
(Gruppen von Messdatensätzen) aufgeteilt. Für jeder dieser Datensatzteile wird eine Ermitt- 
lung der Parameter des Modells durchgeführt, sodass der Fehler zwischen Ausgangsdaten des 
physikalischen Modells und den Ausgangs-Messdaten der Gruppe von Messdatensätzen mi- 
nimiert wird. Die Parameteroptimierungen ergeben g/n Parametersätze Sı,..,gn. Jeder Modell- 
Parameterwertesatz enthält in dem Beispiel m Modell-Parameterwerte Pı,..m. Ausgehend von 
den so identifizierten Parameterwerten, wird für jeden Parameter die Modell-Parameterwert- 
verteilungen identifiziert. Für jeden Parameter, mit dem ein abnormaler Zustand erzeugt wer- 


den soll, kann die Verteilung an eine vorgegebene Wahrscheinlichkeitsverteilung, in Fig. 1d 
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eine Normalverteilung, gefittet werden. Diese Normalverteilung wird für die nachfolgend 


vorgestellte Erzeugung von abnormalen Zuständen verwendet. 


Zusätzlich werden Parameterwertverteilungen des Normalzustands verwendet (Block „Iden- 
tifikation der Parameterverteilung‘“), aus denen Modellparameterwerte für die Generierung 
der synthetischer Normalzustandsdaten gezogen werden. Die Parameterwerte können entwe- 
der direkt in eine Wahrscheinlichkeitsverteilung überführt werden oder die Parameterwerte 
können an verschiedene Wahrscheinlichkeitsverteilungen wie Normalverteilungen, multiva- 
riate Normalverteilungen, Chi-Quadrat-Verteilungen, Betaverteilungen, Dreiecksverteilun- 
gen usw. gefittet werden. In Fig. 1d wird dargestellt, wie die Parameterverteilung in einzelne 
Normalverteilungen (engl. Single Gaussian Distribution, SDL) und Mehrdimensionale Nor- 


malverteilungen (engl. Multivariate Gaussian Distribution, MDL) gefittet werden. 


Aus diesen Wahrscheinlichkeitsverteilungen werden anschließend Modell-Parameterwerte 
gezogen (Block „Statistische Ziehung“). Mit diesen Werten wird das Modell parametriert. 
Aus den Eingangsdatenverteilungen werden optional die Eingangsdatenwerte gezogen. In an- 
deren Worten können für die erste Mehrzahl von Simulationen des physikalischen Modells 
ferner basierend auf einer statistischen Verteilung der Eingangs-Messdaten ein oder mehrere 
Eingangs-Daten ausgewählt werden. Das Modell wird mit den gezogenen Parameterwerten 
und Eingangsdatenwerten simuliert. Dadurch entsteht ein synthetischen Datensatz (der ersten 
Mehrzahl von Trainingsdatensätzen) mit (optionalen) Eingangsdaten und Ausgangsdaten im 
Normalzustand. Dieser Vorgang kann so oft wiederholt werden, bis eine gewünschte Anzahl 
an synthetischen Normalzustandsdaten (der ersten Mehrzahl von Trainingsdatensätzen) er- 


reicht ist. 


Das vorgeschlagene Konzept wird ferner zur Erzeugung von abnormalen Zuständen, d.h. etwa 
Fehler-, Vor-Fehler-zuständen oder anderen abnormalen Zustände genutzt, d.h. zur Erzeu- 
gung der zweiten Mehrzahl von Trainingsdaten. Wie aus dieser Abgrenzung ersichtlich ist, 
bilden die erste Mehrzahl von Trainingsdatensätzen einen Normalzustand des technischen 
Bauteils ab und bilden die zweite Mehrzahl von Trainingsdatensätzen einen oder mehrere 
abnormale Zustände, wie etwa einen Beobachtungszustand, einen Vor-Fehlerzustand oder ei- 
nen Fehlerzustand des technischen Bauteils ab. Die Erzeugung von Fehlerzuständen basiert 
auf der Manipulation von Parameterwerten des physikalischen Modells. Dafür können Para- 


meter des Modells identifiziert werden, mit denen potenziell Fehler-, Vor-Fehler-zustände 
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oder andere abnormale Zustände abgebildet werden können. Die Werte der ausgewählten Mo- 
dell-Parameter werden unter Berücksichtigung von Wahrscheinlichkeitsverteilungen be- 
stimmt. Die Wahrscheinlichkeitsverteilungen für die Modell-Parameterwerte im potenziell 
Fehler-, Vor-Fehler-zustand oder, genereller, abnormalem Zustand können häufig nicht aus 
der Mehrzahl von Messdatensätzen identifiziert werden, da Messungen von abnormalen Zu- 
ständen häufig nicht in ausreichend großer Anzahl vorliegen. Stattdessen wird eine Wahr- 
scheinlichkeitsverteilung in Relation zu der Verteilung der Modell-Parameterwerte des Nor- 


malzustands eingeführt, diese wird wie zuvor beschrieben bestimmt. 


Das Verfahren umfasst das Durchführen 150 der zweiten Mehrzahl von Simulationen des 
physikalischen Modells, um die zweite Mehrzahl von Trainingsdatensätzen zu generieren. 
Dabei werden, wie in der ersten Mehrzahl von Simulationen, basierend auf der statistischen 
Verteilung der ermittelten Modell-Parameterwerte (die jeweils auf eine vorgegebene Wahr- 
scheinlichkeitsverteilung gefittet sein können, wie etwa Normalverteilungen, multivariate 
Normalverteilungen, Chi-Quadrat-Verteilungen, Betaverteilungen, Dreiecksverteilungen) ein 
oder mehrere Modell-Parameterwerte für die jeweilige Simulation ausgewählt, jedoch wird 
für jede Simulation zumindest ein Modell-Parameterwert außerhalb des Hauptbereichs der 
statistischen Verteilung (etwa gemäß einer vorgegebenen Wahrscheinlichkeitsverteilung, 
falls die statistische Verteilung an eine vorgegebene Wahrscheinlichkeitsverteilung gefittet 
wurde) der ermittelten Modell-Parameterwerte ausgewählt. Dies steht im Gegensatz zu der 
ersten Mehrzahl von Simulationen, wo alle Modell-Parameterwerte entsprechend der statisti- 
schen Verteilung der jeweiligen ermittelten Modell-Parameterwertes ausgewählt werden. 
Beispielsweise können für die erste Mehrzahl von Simulationen die ein oder mehreren Mo- 
dell-Parameterwerte innerhalb des Hauptbereichs der statistischen Verteilung der ermittelten 
Modell-Parameterwerte ausgewählt werden. Dabei deckt der Hauptbereich der statistischen 
Verteilung zumindest 90 % (oder zumindest 95 %, oder zumindest 98 %) der jeweiligen er- 


mittelten Modell-Parameterwerte ab. 


Ist die statistische Verteilung der Modell-Parameterwerte beispielsweise auf eine Normalver- 
teilung gefittet, wie in Fig. Id, so kann der Hauptbereich der statistischen Verteilung auch im 
Rahmen von Standardabweichungen angegeben werden. Beispielsweise kann für jede Simu- 
lation der zweiten Mehrzahl von Simulationen zumindest ein Modell-Parameterwert basie- 
rend auf einer vorgegebenen Mindestabweichung von einem Erwartungswert einer Normal- 


verteilung der Modell-Parameterwerte ausgewählt wird. Dabei kann die vorgegebene 
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Mindestabweichung zumindest 2,5 (oder zumindest 5) Standardabweichungen betragen. Bei 
anderen vorgegebenen Wahrscheinlichkeitsverteilungen können ähnliche Berechnungs- 
grundlagen ausgewählt werden und beispielsweise die vorgegebene Mindestabweichung von 
einem zentralen Moment erster Ordnung (welche dem Erwartungswert im Fall der Normal- 


verteilung entspricht) aus berechnet werden. 


In Fig. le sind drei exemplarische Wahrscheinlichkeitsverteilungen für drei Intensitäten von 
abnormalen Zuständen dargestellt. Fig. le zeigt ein Diagramm einer Wahrscheinlichkeitsver- 
teilung und einer basierend auf der Wahrscheinlichkeitsverteilung ausgeführten Auswahl ei- 
nes Modell-Parameterwerts. In Fig. le werden die Werte des Modell-Parameters in Bezug auf 
den Mittelwert der Verteilung des zugehörigen Parameters bestimmt. Eine Parametrierung 
des Modells mit Parameterwerten außerhalb der eingeführten Normalzustandsverteilung 
(etwa außerhalb von einem oder zwei Standardabweichungen o um den Erwartungswert) 
führt zu einer Simulation eines abnormalen Zustands. Der Startpunkt der eingeführten Wahr- 
scheinlichkeitsverteilung wird SP bezeichnet, der Endpunkt EP. Über den Start- und End- 
punkt kann die Intensität der Abnormalität (etwa des Fehlers) bei der Simulation eingestellt 
werden. Neben der dargestellten gleichverteilten Verteilung können auch andere Verteilun- 
gen angenommen werden. Entsprechen müssen dann andere Kenngrößen als SP und EP die- 


ser Verteilungen festgelegt werden. 


Zur Erzeugung synthetischer Daten von Fehler-, Vor-Fehlerzuständen oder anderer abnorma- 
ler Zustände werden alle Modell-Parameterwerte aus der jeweiligen Wahrscheinlichkeitsver- 
teilung gezogen, mit Ausnahme des Modell-Parameterwertes, der für die Simulation des ab- 
normalen Zustands verwendet wird. Gerade dieser Modell-Parameterwert wird aus der einge- 
führten Verteilung für die Erzeugung abnormaler Zustände bestimmt. In anderen Worten kann 
für jede Simulation der zweiten Mehrzahl von Simulationen ein Modell-Parameterwert au- 
ßerhalb des Hauptbereichs der statistischen Verteilung der ermittelten Modell-Parameter- 
werte und andere Modell-Parameterwerte, sofern vorhanden, basierend auf (und insbesondere 
entsprechend) der statistischen Verteilung der ermittelten Modell-Parameterwerte ausgewählt 
werden. Weist das physikalische Modell genau einen Modell-Parameter auf, so wird folglich 
kein Parameter entsprechend der statistischen Verteilung der ermittelten Modell-Parameter- 
werte ausgewählt. In manchen Fällen können mehrere Modell-Parameterwerte gleichzeitig 
außerhalb des Hauptbereichs gewählt werden. Beispielsweise kann für zumindest eine Simu- 


lation der zweiten Mehrzahl von Simulationen zumindest zwei Modell-Parameterwerte 
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außerhalb des Hauptbereichs der statistischen Verteilung der jeweiligen Modell-Parameter- 
werteausgewählt werden. Dabei können die zumindest zwei Modell-Parameterwerte basie- 
rend auf einem vorbekannten Zusammenhang zwischen den zwei Modell-Parametern (und 
damit auch Modell-Parameterwerten) ausgewählt werden. Dieses Konzept kann beispiels- 
weise angewandt werden, wenn ein solcher Zusammenhang bekannt ist (etwa, weil die beiden 


Modell-Parameter(werte) linear oder nicht-linear zusammenhängen). 


In manchen Beispielen kann ein geeigneter Wert für jeden Parameter anhand vorhandener 
Messungen abnormaler Zustände festgelegt werden. Diese Werte können durch einen Algo- 
rithmus oder händisch bestimmt werden. Ein solcher Algorithmus sieht vor, die Werte für die 
Kenngrößen der Verteilungen so zu wählen, dass die simulierten abnormalen Zustände mög- 
lichst gut hinsichtlich bestimmter Kriterien im Vergleich zu den vorhandenen Messdaten ab- 
normaler Zustände werden. Dabei ist nicht zwangsläufig das Kriterium des geringsten Fehlers 
zutreffend, da, insbesondere bei geringer Anzahl an Abnormalmessdaten, nicht gegeben ist, 
dass die vorhandenen Abnormalmessdaten die Grundgesamtheit ausreichend abbilden. Daher 
können synthetische Daten, auch wenn Sie keine „perfekte“ Übereinstimmung mit den vor- 
handenen Abnormalmessdaten haben, insgesamt zu einer besseren Leistung des Maschinen- 
lern-Modells führen, als wenn die synthetischen Abnormalzustandsdaten die vorhandenen 


Abnormalzustandsmessdaten perfekt abbilden. 


Das Modell wird mit den ausgewählten Parameterwerten parametrisiert. Die (optionalen) Ein- 
gangs-Daten werden aus den Eingangs-Datenverteilung ausgewählt und dem Modell zuge- 
führt. In anderen Worten kann in manchen Beispielen für die zweite Mehrzahl von Simulati- 
onen des physikalischen Modells ferner basierend auf einer statistischen Verteilung der Ein- 
gangs-Messdaten ein oder mehrere Eingangs-Daten ausgewählt werden (entsprechend der 
Auswahl für die erste Mehrzahl von Simulationen). Anschließend kann das Modell simuliert 
werden. Dieser Vorgang kann so oft wiederholt werden, wie es für die Anwendung erforder- 


lich ist, d.h. bis die Anzahl der zweiten Mehrzahl von Trainingsdaten ausreichend groß ist. 


Das vorliegende Konzept bezieht sich auf das Erzeugen von Trainingsdaten zum Training 
eines Maschinenlern-Modells. Dabei handelt es sich bei den Trainingsdaten um Daten, die 
während des Trainings des Maschinenlern-Modells beispielsweise an einem Eingang oder 


einem Ausgang des Maschinenlern-Modells angelegt werden können, ggf. in verarbeiteter 


10 


15 


20 


25 


30 


FHG21015DE 24 


Form. Weitere Details zu den Eigenschaften der Trainingsdaten werden im Zusammenhang 


mit den Fign. 2a bis 2g erläutert. 


Das vorgeschlagene Konzept kann auf eine Vielzahl von verschiedenen technischen Bautei- 
len angewandt werden, soweit sich das entsprechende technische Bauteil ausreichend genau 
durch ein physikalisches Modell modellieren lässt. Beispielsweise kann das technische Bau- 
teil eine Komponente einer Maschine oder einer technischen Anlage sein, etwa einer Ma- 
schine oder technischen Anlage der Energiewirtschaft. Insbesondere kann das technische 
Bauteil ein elektrotechnisches Bauteil sein, etwa eines von einem Transformator, einem Last- 
stufenschalter, einem Leistungsschalter, einem Trennschalter, einem Lasttrennschalter, einer 
Schaltanlage, einem Kabel, einer Muffe, einer Freileitung und einer Hochspannungsdurch- 


führung. 


Für die Anwendung der modellbasierten Datenvermehrung zur Erstellung von Diagnosesys- 
temen werden Normalzustandsdaten, ein Modell, das Zusammenhänge des zu diagnostizie- 
renden Betriebsmittels abbildet, ein Algorithmus zur Ermittlung von Modell-Parameterwer- 
ten dieses Modells und optional Daten abnormaler Zustände verwendet. Das Modell, das Zu- 
sammenhänge des zu diagnostizierenden Betriebsmittels abbildet, kann entweder aus der Li- 
teratur entnommen werden oder es kann gezielt ein Modell für die jeweilige Diagnoseaufgabe 


gebildet werden. 


Im Folgenden werden mehrere technische Bauteile nebst der für sie relevanten physikalischen 


Modelle und Modell-Parameter vorgestellt. 


Die vorgestellte modellbasierte Datenvermehrung kann beispielsweise bei der Erstellung von 
Diagnosesystemen für diverse Betriebsmittel der Nieder-, Mittel-, Hoch- und Höchstspan- 
nungsebene eingesetzt werden, um dort den Erfolgsgrad von ML-Diagnosesystemen zu ver- 
bessern. Diese Betriebsmittel haben gemein, dass sie geringe Fehlerraten aufweisen, sodass 


nur, falls überhaupt, geringe Daten zu abnormalen Zuständen vorliegen. 


In einem ersten Beispiel ist das technische Bauteil ein Transformator. Das Modell, das im 
Folgenden verwendet wird, ist der Literatur entnommen und modifiziert. Ein Transformator 
schwingt hauptsächlich aufgrund von zwei Effekten: Magnetostriktion und Lorentz-Kräfte. 


Die Magnetostriktion ist die Ursache für die Schwingung des Transformatorkerns in 
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Kombination mit den magnetischen Kräften. Die 100 Hz-Schwingungskomponente des Kerns 
ist proportional zum Quadrat der am Transformator anliegenden Spannung. Die Lorentz- 
Kräfte bringen die Wicklungen zum Schwingen. Die 100-Hz-Schwingungskomponente ist 
proportional zum Stromquadrat. Diese Beziehungen werden in dem Ausgangsmodell verwen- 
det, das in der Formel (1) vorgestellt wird (entnommen aus Garcia et al: „Transformer Tank 
Vibration Modeling as a Method of Detecting Winding Deformations-Part I: Theoretical 
Foundation“). Aoonz gibt die Schwingungsamplitude der 100-Hz-Komponente an, i den ef- 
fektiven mittleren Strom, u die effektive mittlere Spannung. a und ß sind Koeffizienten zur 
Berücksichtigung der Schwingungsdämpfung entlang des Ausbreitungsweges und als Pro- 
portionalitätsfaktoren, und damit beispielsweise Modell-Parameter des physikalischen Mo- 


dells. 
Aroonz = @ * 7 + ß * u? () 


Transformatoren für die Primär- und Sekundärverteilung werden in der Regel dreiphasig aus- 
gelegt und sind nicht immer symmetrisch belastet. Daher wird das physikalische Modell um 
eine individuelle Betrachtung der Phase 1, 2 und 3 in Formel (2) erweitert. 
Ayonm "+ ta, + taz#ig 
+pıruftßerw+ß, (2) 
* Us 
Der Zusammenhang zwischen Schwingung und dem Quadrat von Strom und Spannung ist 
jedoch nur annähernd linear. Daher wird eine nichtlineare und streng monotone Funktion ein- 
geführt, um die nichtlinearen Komponenten zu berücksichtigen. Formel 3 stellt das in diesem 
Beispiel verwendete physikalische Modell für Transformatorschwingungen dar. b ist der Pa- 
rametervektor und X der Eingangsvektor. 
Ayoonz Am u ta + tazr+il 
+prWt+ßruWtßs 0) 
*u3?) = Ab %) 


Für dieses Modell sind die Modell-Parameter a1, &3, @3, Pı, ß>, Pz und die nichtlineare Funk- 
tion A durch einen Parametrisierungsalgorithmus ermittelt worden. Das Modell besteht aus 
einem linearen Teil b — - X und einem nichtlinearen Teil A. Daher wird die Parametrierung in 
zwei Stufen durchgeführt, eine Stufe für die Optimierung des nichtlinearen Teils und eine 


Stufe für die Optimierung des linearen Teils. Die beiden Stufen wurden abwechselnd 
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durchgeführt, um das Ergebnis der Parametrierung kontinuierlich zu verbessern, bis ein Ab- 


bruchkriterium erreicht ist. 


Der Vorgang der Parametrierung ist in Fig. 1f dargestellt. Fig. If zeigt ein Diagramm eines 
Beispiels eines Ermittelns von Modell-Parameterwerten für ein physikalisches Modell eines 


Transformators. Die Funktion A wird mit der Identitätsfunktion initialisiert. In der ersten Stufe 


werden die Parameter des physikalischen Modells b durch Lösen von A 1(A)=b- X mit 
einer Methode der kleinsten Quadrate bestimmt. In der zweiten Stufe wird die nichtlineare 
Funktion A mit einer isotonischen Regression identifiziert. Die isotonische Regression bildet 
zwischen einer abhängigen und einer unabhängigen Variable ab. In diesem Beispiel werden 
durch die Verwendung einer isotonischen Regression keine Annahmen durch eine Vorpara- 


metrisierung, Funktionsform oder Grad benötigt. 


Zur Anwendung der modellbasierten Datenvermehrung unter Verwendung des Transforma- 
tor-Vibrationsmodells, werden die Verteilungen der Modell-Parameterwerte für die Modell- 
Parameter a, &2, &3, Pı, Ba, ßz ermittelt. Die nichtlineare Funktion A wird nur einmal an alle 
Messungen angepasst und für die Generierung der synthetischen Daten nicht variiert. Wendet 
man diese Methode auf die Diagnoseaufgabe des Transformatorfehlers an, können Fehler-, 
Vor-Fehler-zustände oder andere abnormale Zustände mit den Modell-Parametern 
a1, 2, Aa, ßı, ß2, ßz sequenziell simuliert werden. Der Startpunkt der Verteilung für abnor- 
male Zustände wird beispielsweise SP = Unormalzustand + >0 und der Endpunkt auf EP = 
HNormalzustang + 250 gesetzt, wobei Unormalzustand in der Normalverteilung dem Erwar- 


tungswert entspricht. 


Ein zweites Beispiel befasst sich mit der Berechnung der Heißpunktemperatur eines Trans- 
formators (engl. hot spot temperature) in Abhängigkeit von Umgebungstemperatur, Last und 
Transformatorkenngrößen nach DIN IEC 60076-7 oder Susa et al: „A Simple Model for Cal- 
culating Transformer Hot-Spot Temperature”. Eine Erhöhte Temperatur lässt Rückschlüsse 
auf Zustand des Transformators zu. Diese Modelle können für die modellbasierte Datenver- 


mehrung (auch engl. Model-based Data Augmentation, MDA) eingesetzt werden. 


Nach DIN IEC 60076-7 berechnet sich die Heißpunkttemperatur aus der Summe der Umge- 
bungstemperatur @4mp, der Übertemperatur der obersten Ölschicht ABzor, und der Tempera- 


turdifferenz zwischen Heißpunkt und oberster Ölschicht AQysr. Das Modell kann nach DIN 
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IEC 60076-7 Abschnitt 8.2.3 mit Differentialgleichungen in einem Blockdiagramm darge- 
stellt werden. Es werden drei Stränge betrachtet, die die jeweiligen Eingangsgrößen (etwa 
Eingangsdaten oder Eingangs-Messdaten) K, Kund O4m» aufweisen, K beschreibt dabei einen 


zeitveränderlichen Lastfaktor und 9,mp die Umgebungstemperatur. Im ersten Strang wird 


kzı k2ı-1 
1+k22Tw'S = 14.5 
22'Tw E: 





Ad,;sr aus berechnet, was wiederum aus Adysr.r : K” hervorgeht. sist die 


Laplace-Variable. Im zweiten Strang wird ee - 


——— berechnet, was wiederum aus Adrorr ' 
K11'To'S 


1+R-K? 
C 1+R 





) hervorgeht. Im dritten Strang wird a mit dam» als Eingangsgröße berechnet. 
11'F0° 


Durch Addition des zweiten und dritten Strangs wird Oror berechnet, durch Addition aller 
drei Stränge Oysr. Die Parameter dabei sind die zeitabhängige Ölübertemperatur Adror(t), 
der Wicklungslastfaktor Kwicktung, der Wicklungsexponent y, die Bemessungsölübertempe- 
ratur Adysr,r. Die Parameter kzı, kıı und k,, sind von dem Transformator und Kühlungsart 
abhängig, Zeitkonstanten der Wicklungen bzw. des Öls ty und Tg, Oror Temperatur des Öls 
oben im Transformatortank, 94sr Heißpunkttemperatur des Transformators, O,m»p Umge- 
bungstemperatur. Größe R stellt das Verlustverhältnis zwischen Kurzschluss- und Leerlauf- 
verlusten dar. Beispielsweise können Parameter wie Wicklungsexponenten, Bemessungsöl- 
übertemperatur oder die Parameter k,ı, kıı und kz, nicht immer eindeutig identifiziert wer- 
den oder unterliegen Schwankungen. Daher können diese Parameter mit einem Fitting-algo- 
rithmus durch die Messdaten angepasst werden und anschließend zur Simulation von Nor- 
malzustandsdaten oder auch Daten abnormaler Zustände verwendet werden. So könnten syn- 
thetische Temperaturdaten in unterschiedlichen Betriebszuständen erstellt werden. In anderen 
Worten können die Parameter k,,, kıı und kz, als auszuwählende Modell-Parameter dieses 
Modells verwendet werden (d.h. als Modell-Parameter, deren Werte in der zweiten Mehrzahl 
von Simulationen außerhalb des Hauptbereichs der statistischen Verteilung ausgewählt wer- 
den können), und die zuvor genannten Eingangsgrößen als Eingangsdaten/Eingangs-Messda- 


ten. 


Ein drittes Beispiel befasst sich mit einem physikalischen Modell eines Gebäudes. In diesem 
Fall kann das Gebäude, oder ein Raum des Gebäudes, als technisches Bauteil aufgefasst wer- 
den. Das folgende physikalisches Modell nach Schenk: „Thermische Bemessung von Netz- 
stationen“ ist ein thermisches Gebäudemodell eines Gebäudes mit Wärmequelle und Verbin- 
dung zur Umgebung in Form eines Wärmenetzes. Folgende Größen werden in dem Modell 


berücksichtigt: Pr,: Wärmeleistung Wärmequelle, C7„:thermische Kapazität der 
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Wärmequelle, Cs,: Thermische Kapazität der Station, Rxz: Konvektion Raumluft > Innen- 
wand, Rxı: Konvektion Wärmequelle > Kabinenluft, Ry: Natürliche oder forcierte Konvek- 
tion durch Belüftung, Rsı: Strahlung Wärmequelle > Rauminnenwand, Rx3: Konvektion 
Außenwand > Umgebungsluft, Rs,: Strahlung Außenwand > Umgebung, Ryr: Wärmelei- 


tung Innenwandseite > Außenwandseite, und 6 ,„p:Umgebungstemperatur 


In diesem Modell nach können diverse Parameter wie beispielsweise die Wärmeleitung in- 
nerhalb von Wänden, Parameter bei der Konvektion von Wänden zu Luft nicht genau aus 
Datenblättern o.Ä. bestimmt werden oder unterliegen Schwankungen. Diese Parameter kön- 
nen als Modell-Parameterwerte des physikalischen Modells mit einem Fitting des Modells an 
Messdaten bestimmt werden. Durch eine Simulation mit diesen Modell-Parameterwerten 
können abnormale Zustände wie zu starke Belüftung oder Auskühlung durch Schäden an 


Wänden, der Belüftungseinrichtung oder auch an der Wärmequelle identifiziert werden. 


Ein viertes Beispiel sind Belüftungsmodelle, welche eine Abbildung natürlicher oder forcier- 
ter Belüftung eines Gebäudes/Raums durch physikalische Modelle in Abhängigkeit von Be- 
lüftungskenngrößen bereitstellt. Diese Modelle bilden Größen wie Gebäudetemperatur, Luft- 
druck im Gebäudeinneren und Druck außen vom Gebäude und Außentemperatur ab. Dadurch 
könnten Diagnosesysteme geschaffen werden, die Defekte am Belüftungsmechanismus auf- 
decken oder auch offenstehende Fenster etc. identifizieren. Diese Modelle können für die 


modellbasierte Datenvermehrung eingesetzt werden. 
Für eine natürliche Belüftung kann beispielsweise ein Modell nach Degefa et al.: „Dynamic 
Thermal Modeling of MV/LV Prefabricated Substations“ verwendet werden. 


O.abini ze Oamp 


V= fi * Ayent * 2*+ 





(HH) xg+ 





Oamp 


V ist der resultierende Volumenstrom durch bspw. ein Fenster oder Gitter. Ayenı ist die Fläche 
des Gitters. f; ist eine Funktion, die den Volumenstrom durch die Gitter skaliert, A; die trei- 
bende Druckhöhe und ®.apin,i die Kabinentemperatur. Die Funktion f; kann als Modell-Pa- 
rameterwert durch einen Fitting-Algorithmus bestimmt werden und für die Simulation von 
abnormalen Zuständen angepasst werden. Die Parameter dieser Funktion können beispiels- 
weise für die Simulation von Normal- und abnormalen Zuständen angepasst und verwendet 


werden. Damit können dann beispielsweise verstopfte Lüftungsgitter etc. simuliert werden 
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und über die modellbasiert Datenvermehrung in Maschinenlern-Modelle eingebunden wer- 


den. 


In Rusek et al.: „Monitoring and Diagnosis of Pantograph Disconnectors“ wird ein blockba- 
siertes Modell vorgestellt, das einen Pantographentrennschalter repräsentiert. Die Blöcke bil- 
den bewegliche Bauteilen, Antrieb und Bewegungsmechanismus ab. Dieses Modell weist di- 
verse Modell-Parameter wie Versorgungsspannung des DC-Motors, Widerstandswerte von 
Kabeln oder eines Vorwiderstands, oder auch Feder- und Dämpfungskonstanten der durch 
Federn und Dämpfern repräsentierten Pantographenarme auf. Im Modell können diverse Grö- 
Ben abgegriffen werden, die auch messtechnisch an einem Pantographentrennschalter (als 
Eingangs- oder Ausgangs-Messdaten) erfasst werden können wie beispielsweise Drehzahl 
des DC-Motors, benötigter Strom des DC-Motors etc. Die Versorgungsspannung ist zwischen 
verschiedenen Schalthandlungen nicht, wie in dem Modell angenommen, konstant, die 
Dämpfungs- und Federkonstanten, Funktionen wie die Motormagnetisierungsfunktion, Rei- 
bungskonstanten etc. können häufig nicht vollständig anhand technischer Datenblätter be- 
stimmt werden. Diese können als Modell-Parameterwerte mit einem Fitting-Algorithmus be- 
stimmt werden und anschließend für die Normalzustandssimulation aus den identifizierten 
Parameterwertverteilungen gezogen werden. Diese Parameter können auch eingesetzt wer- 
den, um synthetische Daten abnormaler Zustände mit der modellbasierten Datenvermehrung 
zu generieren. Damit können beispielsweise weiche Scherenarme, verringerte Versorgungs- 


spannung, erhöhte Reibung etc. simuliert werden. 


Ein weiteres Beispiel bezieht sich auf ein Wärmenetz eines 3-phasigen Kabels nach IEC 
60287. Dabei sind mögliche Parameter des Modells die Hauptverluste des Kabels W., also die 
Verluste, die durch den Stromfluss durch einen Widerstand entstehen (I?R-Verluste), Ein- 
flüsse des Skin-Effekt W,, sowie die dielektrischen Verluste W,, die für Spannungsebenen 
kleiner 127 kV nicht berücksichtigt werden müssen. Weitere Parameter sind beispielsweise 
T} thermischer Widerstand pro Kabel zwischen Leiter und Schirm, T, thermischer Widerstand 
zwischen Schirm und Armierung, T3 thermischer Widerstand des Außenmantels, Tythermi- 
scher Widerstand der Umgebung. Die thermischen Widerstände können durch interne oder 
externe Einflüsse variieren, ebenso können Parameter, die zur Berechnung von W,, W, und 
W, benötigt werden, variieren. Diese können als Modell-Parameterwerte über einen Fitting- 
Algorithmus bestimmt werden. Damit können über die modellbasierte Datenvermehrung syn- 


thetische Normalzustandsdaten- und Daten abnormaler Zustände generiert werden. Die 


10 


15 


20 


25 


30 


FHG21015DE 30 


Modell-Parameterwerte können in der Simulation von abnormalen Zuständen eingesetzt wer- 
den, um lokale Widerstandserhöhungen, oder beschädigte Ummantelung zu simulieren. Diese 


haben einen Einfluss auf die Temperatur des Kabels. 


Ein weiteres Beispiel bezieht sich auf Freileitungen. Bei Freileitungen ist ebenfalls die Tem- 
peratur von Bedeutung, da mögliche Heißpunkte auf eine schlechte elektrische Leitfähigkeit 
hindeuten. Die Cigre Working Group B2.43 hat 2014 im “Guide for Thermal Rating Calcu- 
lations of Overhead Lines” die Wärmebilanzgleichung vereinfacht mit 
PP +P=Pc+PR 
dargestellt. P, ist der Beitrag von joulschen Verlusten, P, der Wärmeeintrag durch Sonnen- 
einstrahlung, Pc konvektive Kühlung und F, radiative Kühlung. P, kann mit 
PR = I? * Roc 
berechnet werden. / ist dabei der Strom, der durch die Freileitung fließt. Rp. ist der DC- 
Widerstand der Freileitung pro Längeneinheit. Dieser hängt von dem spezifischen Widerstand 
des Materials ab. Ps kann mit 
Ps =a,*Ir *D 
berechnet werden. a, beschreibt dabei den Absorptionskoeffizienten der Oberfläche der Frei- 
leitung, I die Intensität der Globalstrahlung und D den Außendurchmesser der Freileitung. 
Die Cigre Working Group stellt noch eine weitere Möglichkeit dar, wie P, berechnet werden 
kann. 
P. wird mit 
Pe =n*A,*(T,— Ta) * Nu 
berechnet. A, ist die Wärmeleitfähigkeit von Luft bei T;. T; ist die Temperatur der Luftschicht, 
die in Kontakt mit der Freileitungsoberfläche ist. T, und T, sind die Temperaturen des Leiters 
und der Luft. 
P- wird mit 


P=n#+Dr0g+P-g*es* (Ts + 273)? - (T, + 273)" | ++ Drop + c-sky * €s 


* [(T; + 273)* — (Tory + 273) ] 
berechnet. D ist der Außendurchmesser des Leiters, oz die Stefan-Boltzmann Konstante, e, 
der Emissionsgrad der Oberfläche des Leiters, T, die Temperatur des Leiters, T, die Tempe- 
ratur des Bodens unter dem Leiter, T,x, die Temperatur des Himmels über dem Leiter, F._g 
der Teil der vom Leiter abgestrahlten Energie an den Boden und die Umgebung und F._sry 


der Teil der vom Leiter abgestrahlten Energie in den Himmel. 
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Für dieses Modell kann die modellbasierte Datenvermehrung angewendet werden, indem Pa- 
rameter wie Rpc, oder die Anteile der abgestrahlten Energie F._g und F._sxy als Modell- 
Parameterwerte mit einem Algorithmus mehrfach gefittet werden. Über die modellbasierte 
Datenvermehrung können dann synthetische Normalzustandsdaten erzeugt werden. Abnor- 


male Zustände können durch eine Erhöhung von R). generiert werden. 


Die Schnittstelle 12 kann beispielsweise einem oder mehreren Eingängen und/oder einem 
oder mehreren Ausgängen zum Empfangen und/oder Übertragen von Informationen entspre- 
chen, etwa in digitalen Bitwerten, basierend auf einem Code, innerhalb eines Moduls, zwi- 


schen Modulen, oder zwischen Modulen verschiedener Entitäten. 


Beispielsweise können die ein oder mehreren Prozessoren 14 einem beliebigen Controller 
oder Prozessor oder einer programmierbaren Hardwarekomponente entsprechen. Beispiels- 
weise kann die Funktionalität der ein oder mehreren Prozessoren 14 auch als Software reali- 
siert sein, die für eine entsprechende Hardwarekomponente programmiert ist. Insofern kön- 
nen die ein oder mehreren Prozessoren 14 als programmierbare Hardware mit entsprechend 
angepasster Software implementiert sein. Dabei können beliebige Prozessoren, wie Digitale 
Signalprozessoren (DSPs) zum Einsatz kommen. Ausführungsbeispiele sind dabei nicht auf 
einen bestimmten Typ von Prozessor eingeschränkt. Es sind beliebige Prozessoren oder auch 


mehrere Prozessoren zur Implementierung denkbar. 


Die ein oder mehreren Speichergeräte 16 können beispielsweise zumindest ein Element der 
Gruppe von computerlesbares Speichermedium, magnetisches Speichermedium, optisches 
Speichermedium, Festplatte, Flash-Speicher, Diskette, Zufallszugriffsspeicher (auch engl. 
Random Access Memory), Programmable Read Only Memory (PROM), Erasable Program- 
mable Read Only Memory (EPROM), Electronically Erasable Programmable Read Only 
Memory (EEPROM), und Netzwerkspeicher umfassen. 


Mehr Details und Aspekte der Datenvermehrung werden in Verbindung mit dem Konzept 
oder Beispielen genannt, die vorher oder nachher (etwa Fign. 2a bis 3b) beschrieben werden. 
Die Datenvermehrung, und damit auch das entsprechende Verfahren, die Vorrichtung und das 


Computerprogramm, kann ein oder mehrere zusätzliche optionale Merkmale umfassen, die 
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ein oder mehreren Aspekten des vorgeschlagenen Konzepts oder der beschriebenen Beispiele 


entsprechen, wie sie vorher oder nachher beschrieben wurden. 


Einen zweiten Aspekt der vorliegenden Offenbarung stellt das Training eines Maschinenlern- 


Modells basierend auf den zuvor generierten Trainingsdaten dar. 


Fig. 2a zeigt ein Flussdiagramm eines Beispiels eines computer-implementierten Verfahrens 
zum Trainieren eines Maschinenlern-Modells zur Vorhersage eines Zustands eines techni- 
schen Bauteils. Das Verfahren umfasst ein Erhalten 210 einer ersten Mehrzahl von Trainings- 
datensätzen und einer zweiten Mehrzahl von Trainingsdatensätzen. Die erste Mehrzahl von 
Trainingsdatensätzen und die zweite Mehrzahl von Trainingsdatensätzen sind basierend auf 
dem Verfahren der Fign. la bis If generiert. In anderen Worten basieren die erste und zweite 
Mehrzahl von Trainingsdatensätzen auf einer modellbasierten Datenvermehrung. Die erste 
und zweite Mehrzahl von Trainingsdatensätzen stellen synthetisch generierte Trainingsdaten- 
sätze dar. Dabei bilden die erste Mehrzahl von Trainingsdatensätzen einen Normalzustand 
des technischen Bauteils ab. Die zweite Mehrzahl von Trainingsdatensätzen bildet einen oder 
mehrere abnormale Zustände des technischen Bauteils ab. Optional umfasst das Verfahren 
ferner ein Erhalten 220 einer Mehrzahl von Messdatensätzen über das technische Bauteil. Das 
Verfahren umfasst ferner ein Trainieren 230 des Maschinenlern-Modells basierend auf der 
ersten Mehrzahl von Trainingsdatensätzen und basierend auf der zweiten Mehrzahl von Trai- 
ningsdatensätzen, und optional, basierend auf der Mehrzahl von Messdatensätzen basiert. Das 
Verfahren kann ferner ein Bereitstellen oder Ausgeben des Maschinenlern-Modells umfassen, 


etwa über eine Schnittstelle oder über eine Speichereinrichtung. 


Fig. 2b zeigt ein Blockdiagramm eines Beispiels einer entsprechenden computer-implemen- 
tierten Vorrichtung zum Trainieren eines Maschinenlern-Modells zur Vorhersage eines Zu- 
stands eines technischen Bauteils. Die Vorrichtung 20 umfasst ein oder mehreren Prozessoren 
24 und ein oder mehreren Speichereinrichtungen 26. Optional umfasst die Vorrichtung 20 
ferner eine Schnittstelle 22. Die Vorrichtung 20 ist ausgebildet zum Durchführen zumindest 
des Verfahrens von Fig. 2a. Optional kann die Vorrichtung 20 ferner ausgebildet sein, um das 
Verfahren von Fig. la und/oder das Verfahren von Fig. 3a auszuführen. Dabei wird die Funk- 
tionalität der Vorrichtung 20 von den ein oder mehreren Prozessoren 24 der Vorrichtung be- 
reitgestellt, unter Zuhilfenahme der optionalen Schnittstelle 22 (etwa zum Erhalten der Trai- 


ningsdatensätze und der Messdatensätze) und der ein oder mehreren Speichereinrichtungen 
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(etwa zum Speichern der Messdatensätze, der Trainingsdatensätze und des Maschinenlern- 


Modells). 


Die folgende Beschreibung bezieht sich sowohl auf das Verfahren von Fig. 2a als auch auf 
ein entsprechendes Computerprogramm und die entsprechende Vorrichtung von Fig. 2b. 
Merkmale, die im Zusammenhang des Verfahrens eingeführt werden, können daher auch in 
die entsprechende Vorrichtung und das Computerprogramm übernommen werden (und um- 


gekehrt). 


Durch das Verfahren, die Vorrichtung und das Computerprogramm der Fign. 2a bis 2g wer- 
den die Trainingsdatensätze, die entsprechend der Lehre der Fign. la bis If generiert wurden, 
genutzt, um das Maschinenlern-Modell zu trainieren. Maschinelles Lernen bezieht sich, im 
Allgemeinen, auf Algorithmen und statistische Modelle, die Computersysteme verwenden 
können, um eine bestimmte Aufgabe ohne Verwendung expliziter Anweisungen auszuführen, 
durch Nutzung von Modellen und Inferenz. Beim maschinellen Lernen kann beispielsweise 
anstatt einer auf Regeln basierenden Transformation von Daten, eine Transformation von Da- 
ten verwendet werden, die aus einer Analyse von Verlaufs- und/oder Trainings-Daten herge- 
leitet werden kann. Beispielsweise kann der Inhalt von Bildern unter Verwendung eines Ma- 
schinenlern-Modells oder unter Verwendung eines Maschinenlern-Algorithmus analysiert 
werden. Damit das Maschinenlern-Modell den Inhalt eines Bildes analysieren kann, kann das 
Maschinenlern-Modell unter Verwendung von Trainingsbildern als Eingabe und Trainings- 
inhaltsinformation als Ausgabe trainiert werden. Durch Trainieren des Maschinenlern-Mo- 
dells mit einer großen Anzahl von Trainingsbildern und zugeordneter Trainingsinhaltsinfor- 
mation (zZ. B. Kennzeichnungen oder Anmerkungen) „lernt“ das Maschinenlern-Modell, den 
Inhalt der Bilder zu erkennen, sodass der Inhalt von Bildern, die in den Trainingsdaten nicht 
umfasst sind, unter Verwendung des Maschinenlern-Modells erkannt werden kann. Das glei- 
che Prinzip kann für andere Arten von Sensordaten, vorverarbeiteten Sensordaten oder aus 
Sensordaten extrahierten Informationenebenfalls verwendet werden: Durch Trainieren eines 
Maschinenlern-Modells unter Verwendung von Trainingssensordaten und einer erwünschten 
Ausgabe „lernt“ das Maschinenlern-Modell eine Umwandlung zwischen den Sensordaten und 
der Ausgabe, was verwendet werden kann, um eine Ausgabe basierend auf an das Maschi- 


nenlern-Modell bereitgestellten Sensordaten zu erzeugen. 
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Maschinenlern-Modelle werden unter Verwendung von Trainingseingabedaten trainiert. Die 
oben angeführten Beispiele verwenden ein Trainingsverfahren, das „Supervised Learning“ 
(Überwachtes Lernen) genannt wird. Beim Supervised Learning wird das Maschinenlern-Mo- 
dell unter Verwendung einer Mehrzahl von Trainingsdatensätzen trainiert, wobei jeder Da- 
tensatz eine Mehrzahl von Eingabedatenwerten und eine Mehrzahl von erwünschten Ausga- 
bewerten, d. h. jedem Trainingsdatensatz ist ein erwünschter Ausgabewert zugeordnet, um- 
fassen kann. Durch Angeben sowohl von Trainingsdatensätzen als auch erwünschten Ausga- 
bewerten „lernt“ das Maschinenlern-Modell, welcher Ausgabewert basierend auf einem Ein- 
gabeabtastwert, der ähnlich zu den während des Trainings bereitgestellten Abtastwerten ist, 
bereitzustellen ist. Supervised Learning kann auf einem Supervised Learning-Algorithmus 
basieren, beispielsweise auf einem Klassifizierungsalgorithmus. Klassifizierungsalgorithmen 
können verwendet werden, wenn die Ausgaben auf eine begrenzte Menge von Werten (kate- 
gorische Variablen) beschränkt sind, d. h. die Eingabe ist als einer aus dem begrenzten Satz 


von Werten klassifiziert. 


Die durch das Verfahren, die Vorrichtung und das Computer-Programm generierten Trai- 
ningsdatensätze sind Trainingsdatensätze, die zu dem Training des Maschinenlern-Modells 
verwendet werden können. Dazu kann in manchen Fällen eine Vorverarbeitung der Trainings- 
datensätze durchgeführt werden, etwa um Merkmalsvektoren für ein oder mehrere Eingabe- 
schnittstellen des Maschinenlern-Modells zu generieren, oder um den erwünschten Ausgabe- 
wert aus dem jeweiligen Trainingsdatensatz zu extrahieren. Je nach Ausgestaltung des Ma- 
schinenlern-Modells können die Trainingsdatensätze unterschiedliche Bestandteile aufwei- 
sen. Da die Trainingsdatensätze, die im Zusammenhang mit den Fign. la bis If generiert 
werden, die entsprechenden Messdatensätze imitieren, können die Trainingsdatensätze eben- 
falls ein oder mehrere Ausgabedaten (die den ein oder mehreren Mess-Ausgabedaten entspre- 
chen können), und optional ein oder mehrere Eingabedaten (die den ein oder mehreren Ein- 
gabe-Messdaten entsprechen können) umfassen. Diese können in ihrer Ausgestaltung den je- 
weiligen Messdaten entsprechen. Dabei können die ein oder mehreren Ausgabedaten und die 
optionalen ein oder mehreren Eingabedaten in dem Training des Maschinenlern-Modells an 


den jeweiligen Eingängen des Maschinenlern-Modells bereitgestellt werden. 


In einigen Beispielen wird das Maschinenlern-Modell mittels Supervised Learning trainiert, 
d.h. die (ersten und zweiten) Trainingsdatensätze werden zusammen mit entsprechenden er- 


warteten Ausgabenwerten genutzt, um das Maschinenlern-Modell zu trainieren. Dabei kann 
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das Maschinenlern-Modell beispielsweise als sogenannter Klassifikator trainiert werden, d.h. 
das Maschinenlern-Modell wird trainiert, um die Daten, die an den Eingängen des Maschi- 
nenlern-Modells angelegt werden, in eine von zumindest zwei verschiedenen Klassifizierun- 
gen zu klassifizieren. Beispielsweise kann das Maschinenlern-Modell als Klassifikator für 
den Zustand des technischen Bauteils trainiert werden, d.h. die Daten, die an den Eingängen 
des Maschinenlern-Modells angelegt werden, werden genutzt, um den Zustand des techni- 
schen Bauteils in eine von zwei oder mehreren Klassifizierungen zu klassifizieren. Dazu kann 
beispielsweise die Zugehörigkeit der Trainingsdatensätze zu der ersten oder zweiten Mehr- 
zahl von Trainingsdatensätzen als erwartete Ausgabewerte genutzt werden, da die Zugehö- 
rigkeit eines Trainingsdatensatzes zu der ersten Mehrzahl von Trainingsdatensätzen ein Hin- 
weis darauf ist, dass der Trainingsdatensatz einen Normalzustand des technischen Bauteils 
repräsentiert, während die Zugehörigkeit eines Trainingsdatensatzes zu der zweiten Mehrzahl 
von Trainingsdatensätzen ein Hinweis darauf ist, dass der Trainingsdatensatz einen abnorma- 
len Zustand des technischen Bauteils repräsentiert. Folglich können die erste und zweite 
Mehrzahl von Trainingsdatensätzen als Eingabedaten und die Zugehörigkeit der Trainings- 
datensätze zu einer der ersten und zweiten Mehrzahl von Trainingsdatensätzen als erwünschte 
Ausgabedaten für das Supervised Learning-basierte Training verwendet werden. Alternativ 
oder zusätzlich kann Wissen darüber, mit welchem Modell-Parameterwert (oder welcher Mo- 
dell-Parameterwert außerhalb des Hauptbereichs der statistischen Verteilung ausgewählt 
wurde) ein Trainingsdatensatz der zweiten Mehrzahl von Trainingsdatensätzen entstanden ist, 
als Ausgabewert genutzt werden, da damit ein Rückschluss auf den Typ eines möglichen ab- 


normalen Zustands gezogen werden kann. 


Dabei kann das Maschinenlern-Modell beispielsweise darauf trainiert werden, eine Klassifi- 
kation zwischen einem Normalzustand und ein oder mehreren abnormalen Zuständen des 


technischen Bauteils zu treffen. 


In einem einfachen Beispiel kann die Klassifikation beispielsweise zwischen den beiden Zu- 
ständen ‚„Normalzustand“ und „Fehlerzustand“ erfolgen. Dafür kann das Maschinenlern-Mo- 
dell trainiert werden, um basierend auf einen Datensatz mit Messdaten (die an die Eingänge 
des Maschinenlern-Modells angelegt werden) den Zustand des technischen Bauteils in eine 
der Klassifikationen Normalzustand und Fehlerzustand einzuteilen. Dabei kann der Fehlerzu- 


stand beispielsweise eine Form des „abnormalen Zustands“ sein. 
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In einem weiteren Beispiel kann ein zusätzlicher Zustand unterschieden werden. Beispiels- 
weise kann das Maschinenlern-Modell trainiert werden, um basierend auf einen Datensatz 
mit Messdaten den Zustand des technischen Bauteils in eine der Klassifikationen Normalzu- 
stand, Vor-Fehlerzustand und Fehlerzustand einzuteilen. Dabei kann der Vor-Fehlerzustand 
ein Zustand sein, der zwischen dem Normalzustand und dem Fehlerzustand einzuordnen ist. 
Beispielsweise kann der Vor-Fehlerzustand ein Zustand sein, der nicht (unmittelbar) zu einem 
Fehler oder Ausfall des technischen Bauteils führt, aber der dennoch beobachtet werden 
sollte. Dabei kann der Vor-Fehlerzustand auch ein ungefährlicher Zustand sein. Der Vor-Feh- 


lerzustand kann eine weitere Form des „abnormalen Zustands“ sein. 


In einer weiteren Ausführungsform kann das Maschinenlern-Modell ferner genutzt werden, 
um eine Fehlertypisierung durchzuführen. Dazu kann das Maschinenlern-Modell trainiert 
werden, um zwischen dem Normalzustand und unterschiedlichen Fehlerzuständen zu unter- 
schieden. Beispielsweise kann das Maschinenlern-Modell trainiert werden, um basierend auf 
einen Datensatz mit Messdaten einen Zustand des technischen Bauteils in zumindest eine der 
Klassifikationen Normalzustand, erster Fehlerzustand und zweiter Fehlerzustand einzuteilen. 
Auch Mischformen sind möglich. Beispielsweise kann das Maschinenlern-Modell trainiert 
werden, um basierend auf einen Datensatz mit Messdaten einen Zustand des technischen Bau- 
teils in zumindest eine der Klassifikationen Normalzustand, ein oder mehrere unterschiedli- 


che Vor-Fehlerzustände und ein oder mehrere Fehlerzustände einzuteilen. 


Die synthetischen Trainingsdatensätzen können auf verschiedene Arten in die Erstellung und 


insbesondere das Training des Maschinenlern-Modells integriert werden. 


Einerseits kann das Maschinenlern-Modell ausschließlich basierend auf den synthetischen 


Trainingsdatensätzen trainiert werden. 


Alternativ kann das Maschinenlern-Modell basierend auf den synthetischen Trainingsdaten- 
sätzen und basierend auf der Mehrzahl von Messdatensätzen trainiert werden, wie im Folgen- 


den ausgeführt wird. 


Hierbei sind wiederum mehrere Alternativen möglich. Der erste Ansatz sieht vor, dass die 
vorhandenen Messdatensätze mit synthetischen Daten erweitert wird. Beispielsweise können 


die synthetischen Trainingsdatensätze (oder zumindest die zweite Mehrzahl von 
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Trainingsdatensätzen) mit den Messdatensätzen kombiniert werden, um das Maschinenlern- 
Modell zu trainieren. Dabei können die Messdatensätze entweder mit nur synthetischen Nor- 
malzustandsdaten (der ersten Mehrzahl von Trainingsdatensätzen) oder mit nur synthetischen 
Daten abnormaler Zustände (der zweiten Mehrzahl von Trainingsdatensätzen) oder mit syn- 
thetischen Normal- und Daten abnormaler Zustände erweitert werden. In anderen Worten 
können die Mehrzahl von Messdatensätzen um die erste und/oder zweite Mehrzahl von Trai- 
ningsdatensätzen erweitert werden und das Maschinenlern-Modell gemeinsam basierend auf 
der Mehrzahl von Messdatensätzen und der ersten und/oder zweiten Mehrzahl von Trainings- 


datensätzen trainiert werden. 


Die Fign. 2c und 2d zweigen zwei Beispiele einer Vermischung von Messtrainingsdaten und 
synthetischen Trainingsdaten. In Fig. 2c werden die Messdatensätze (Observationen) Nonz 
des Normalzustands und no,rz des abnormalen Zustands durch die modellbasierte Datenver- 
mehrung um synthetische Daten ny4,nz des Normalzustands und np, ,rz des abnormalen Zu- 
stands ergänzt; die jeweiligen Datensätze non, und NpAnz SOWIE No,rz Und npAyz werden 
jeweils für das Training des Maschinlern-Modells kombiniert. Alternativ können, wie in Fig. 
2d gezeigt wird, durch die modellbasierte Datenvermehrung ausschließlich synthetische Da- 
ten Npa,rz des abnormalen Zustands generiert werden, die mit den Messdatensätzen n.,rz des 


abnormalen Zustands für das Training des Maschinlern-Modells kombiniert werden. 


Der zweite Ansatz sieht vor, dass mit synthetischen Daten der modellbasierten Datenvermeh- 
rung eine Quelldomäne erschaffen wird, mit der Maschinenlern-Modelle trainiert werden 
können. Die synthetischen Daten können durch die modellbasierte Datenvermehrung oder 
auch durch eine andere Art der Datenvermehrung erstellt werden. Die so trainierten Maschin- 
lern-Modelle können anschließend mit Verfahren des sogenannten Transfer Learning (Trans- 
ferlernen) auf die zur Verfügung stehenden Messungen transferiert werden. Beispielsweise 
kann das Maschinenlern-Modell in einem ersten Schritt basierend auf der ersten und zweiten 
Mehrzahl von Trainingsdatensätzen trainiert werden. Das Training des Maschinenlern-Mo- 
dells kann in einem zweiten Schritt mittels Transfer Learning basierend auf der Mehrzahl von 
Messdatensätzen fortgeführt werden. Dies bietet das Potential den Einfluss von Ungenauig- 
keiten des Modells oder Simulationsungenauigkeiten auf das Diagnosesystem durch das 
Nachtrainieren mit Messungen zu verringern. Allgemeines, gelerntes Wissen über die im Mo- 
dell und der Simulation hinterlegten Zusammenhänge können im Maschinenlern-Modell er- 


halten werden. 


10 


15 


20 


25 


30 


FHG21015DE 38 


Fig. 2e ein Beispiel eines Transfer Learning-Ansatzes. Hier stehen die Messdaten des Nor- 
malzustands und abnormalen Zustands zur Verfügung, wobei die Messdaten des Normalzu- 
stands für die modellbasierte Datenvermehrung/Datenaugmentierung (MDA) verwendet wer- 
den. Daraus werden, wie auch in Fign. 2c gezeigt, die jeweiligen synthetischen Datensätze 
erstellt. Diese werden zum Training des Maschinenlern-Modells verwendet, entweder eines 
Maschinenlern-Modells mit mehreren Ausgängen oder einem Maschinenlern-Modell mit ei- 
nem Ausgang — d.h. in dem ersten Schritt muss das Maschinenlern-Modell noch nicht 
zwangsläufig auf die Klassifizierung trainiert werden, sondern es kann beispielsweise auch 
auf Zwischenwerte trainiert werden. Mit Hilfe der Messdaten kann anschließend ein Transfer 
Learning, etwa durch Feinanpassung (auch engl. Fine Tuning, FT) oder durch Merkmalsext- 
raktion (Feature Extraction, FE) durchgeführt werden. Durch diesen zweiten Schritt kann das 


Maschinenlern-Modell nun zum Klassifikator trainiert werden. 


Beispielsweise kann eine der der folgenden Transfer Learning-Ansätze verwendet werden. 
Beispielsweise kann das Maschinenlern-Modell in dem ersten Schritt basierend auf den syn- 
thetischen Trainingsdatensätzen als Klassifikator trainiert werden, der direkt zur Klassifizie- 
rung des Zustands des technischen Bauteils verwendet werden kann. Alternativ kann das Ma- 
schinenlern-Modell im ersten Schritt als eigenständiger Merkmalsextraktor trainiert werden. 
Dabei wird das vortrainierte Modell oder ein Teil des Modells verwendet, um den Datensatz 
vorzuverarbeiten und relevante Merkmale zu extrahieren. Alternativ kann das Maschinenlern- 
Modell im ersten Schritt als integrierter Merkmalsextraktor trainiert werden. Das vortrainierte 
Modell oder ein Teil des Modells kann so in ein neues Modell integriert werden, aber die 
Schichten des vortrainierten Modells können während des Trainings eingefroren werden. Al- 
ternativ kann das Maschinenlern-Modell im ersten Schritt als Gewichtsinitialisierung dienen. 
Das vortrainierte Modell oder ein Teil des Modells kann in ein neues Modell integriert wer- 
den, und die Schichten des vortrainierten Modells können zusammen mit dem neuen Modell 


trainiert. Die beiden letztgenannten Alternativen werden im Folgenden vertieft. 


In den Beispielen der Fign. 2f und 2g wird davon ausgegangen, dass das Maschinenlern-Mo- 
dell als mehrschichtiges, künstliches neuronales Netz, insbesondere als mehrschichtiges 
Perzeptron (engl. Multi-Layer Perceptron, MLP) implementiert ist. Inanderen Worten hat das 
Maschinenlern-Modell der Fign. 2fund 2g eine Eingabeschicht, eine Ausgabeschicht und ein 
oder mehrere verborgene Schichten (engl. Hidden Layer). 
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In Fig. 2f wird ein Beispiel eines Transfer Learning-Ansatzes gezeigt, der auf einer Feinein- 
stellung des Maschinenlern-Modells basiert, d.h., es werden die Schichten des vortrainierten 
Maschinenlern-Modells teilweise eingefroren. In anderen Worten kann das Maschinenlern- 
Modell eine Mehrzahl von Schichten umfassen. Die Gewichte zumindest einer Schicht der 
Mehrzahl von Schichten sind während des Transfer Learning eingefroren. In Fig. 2f sind bei- 
spielsweise die Gewichte der Eingabeschicht und der ersten verborgene Schicht eingefroren, 
während die Gewichte der zweiten verborgenen Schicht und der Ausgabeschicht mittels der 
Feinanpassung angepasst werden können. Die Feinabstimmung geht davon aus, dass das Wis- 
sen und die Strukturen eines bereits trainierten MLP für die neue Domäne nützlich sein kön- 
nen, aber eine zusätzliche Anpassung des MLP an die neue Domäne notwendig ist. Obwohl 
das MLP bereits mit Daten und verschiedenen Wahrscheinlichkeitsverteilungen trainiert 
wurde, die sich von der neuen Domäne unterscheiden können, wird dieses bereits trainierte 
MLP als Grundmodell verwendet. Die Übertragung auf die Messdatensätze erfolgt, indem die 
Ausgabeschicht oder die letzten Schichten oder mindestens eine ausgewählte Schicht des 
MLP mit den neuen domänenspezifischen Daten (Mehrzahl von Messdatensätzen) neu trai- 
niert werden (Feinabstimmung). Die Gewichte der anderen Schichten des MLP werden wäh- 


rend des neuen Trainingsvorgangs nicht verändert (Einfrieren), wie in Fig. 2f dargestellt. 


Fig. 2g zeigt dagegen ein Beispiel eines Transfer Learning-Ansatzes, der auf einer Merkmal- 
sextraktion basiert. Ein Ansatz der Merkmalsextraktion ist die Übertragung eines bestehenden 
Maschinenlern-Modells auf eine neue Aufgabe. Das Ziel des Transferlernens mittels Merk- 
malsextraktion ist also, den Teil eines Maschinenlern-Modells, der die Informationen über 
Merkmale und deren Verteilung gelernt hat, wiederzuverwenden und die Aufgabe des Ma- 
schinenlern-Modells anzupassen. Dazu wird der Teil, der für die Klassifikation zuständig ist, 
vom vortrainierten Maschinenlern-Modell getrennt (visualisiert durch die Schere in Fig. 2g). 
Der verbleibende Teil wird als Basismodell für die neue Klassifikationsaufgabe verwendet, 
um ein neues Maschinenlern-Modell zu trainieren, wie in Fig. 2g dargestellt. Zu diesem 
Zweck wird am Ende eine neue Struktur für die Klassifizierung hinzugefügt. Diese hinzuge- 
fügte Struktur wird dann neu basierend auf Mehrzahl von Messdatensätzen trainiert, um die 
Vorhersagefunktion für die neue Aufgabe anzupassen. Dabei können die Gewichte der übri- 


gen Schichten ebenfalls angepasst werden. 
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Maschinenlern-Algorithmen basieren normalerweise auf einem Maschinenlern-Modell. An- 
ders ausgedrückt, der Begriff „Maschinenlern-Algorithmus“ kann einen Satz von Anweisun- 
gen bezeichnen, die verwendet werden können, um ein Maschinenlern-Modell zu erstellen, 
zu trainieren oder zu verwenden. Der Begriff „Maschinenlern-Modell“ kann eine Datenstruk- 
tur und/oder einen Satz von Regeln bezeichnen, die/der das erlernte Wissen darstellt (z. B. 
basierend auf dem durch den Maschinenlern-Algorithmus ausgeführten Training). Bei Aus- 
führungsbeispielen kann die Verwendung eines Maschinenlern-Algorithmus die Verwendung 
eines zugrundeliegenden Maschinenlern-Modells (oder einer Mehrzahl von zugrundeliegen- 
den Maschinenlern-Modellen) implizieren. Die Verwendung eines Maschinenlern-Modells 
kann implizieren, dass das Maschinenlern-Modell und/oder die Datenstruktur/der Satz von 
Regeln, welche das Maschinenlern-Modell ist/sind, durch einen Maschinenlern-Algorithmus 


trainiert wird. 


Beispielsweise kann das Maschinenlern-Modell ein künstliches neuronales Netz (ANN; arti- 
ficial neural network) sein. ANNs sind Systeme, die durch biologische neuronale Netze in- 
spiriert sind, wie sie in einer Netzhaut oder einem Gehirn zu finden sind. ANNs umfassen 
eine Mehrzahl von zwischenverbundenen Knoten und eine Mehrzahl von Verbindungen, so- 
genannte Kanten (edges), zwischen den Knoten. Es gibt normalerweise drei Knotentypen, 
Eingabeknoten, die Eingabewerte empfangen, versteckte Knoten, die (nur) mit anderen Kno- 
ten verbunden sind, und Ausgabeknoten, die Ausgabewerte bereitstellen. Jeder Knoten kann 
ein künstliches Neuron darstellen. Jede Kante kann Informationen senden, von einem Knoten 
zum anderen. Die Ausgabe eines Knoten kann als eine (nichtlineare) Funktion der Eingaben 
definiert sein (z.B. der Summe seiner Eingaben). Die Eingaben eines Knoten können in der 
Funktion basierend auf einem „Gewicht“ der Kante oder des Knoten, der die Eingabe bereit- 
stellt, verwendet werden. Das Gewicht von Knoten und/oder von Kanten kann in dem Lern- 
prozess angepasst werden. Anders ausgedrückt, das Training eines künstlichen neuronalen 
Netzes kann ein Anpassen der Gewichte der Knoten und/oder Kanten des künstlichen neuro- 
nalen Netzes umfassen, d. h. um eine erwünschte Ausgabe für eine bestimmte Eingabe zu 


erreichen. 


Alternativ kann das Maschinenlern-Modell eine Support-Vector-Machine, ein Random-Fo- 
rest-Modell oder ein Gradient-Boosting-Modell sein. Support Vector Machines (d. h. Stütz- 
vektornetze) sind Supervised Learning-Modelle mit zugeordneten Lernalgorithmen, die ver- 


wendet werden können, um Daten zu analysieren (z. B. in einer Klassifizierungs- oder 
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Regressionsanalyse). Support Vector Machines können durch Bereitstellen einer Eingabe mit 
einer Mehrzahl von Trainingseingabewerten, die zu einer von zwei Kategorien gehören, trai- 
niert werden. Alternativ kann das Maschinenlern-Modell ein bayessches Netz sein, das ein 
probabilistisches gerichtetes azyklisches graphisches Modell ist. Ein bayessches Netz kann 
einen Satz von Zufallsvariablen und ihre bedingten Abhängigkeiten unter Verwendung eines 
gerichteten azyklischen Graphen darstellen. Alternativ kann das Maschinenlern-Modell auf 
einem genetischen Algorithmus basieren, der ein Suchalgorithmus und heuristische Technik 


ist, die den Prozess der natürlichen Selektion imitiert. 


Die Schnittstelle 22 kann beispielsweise einem oder mehreren Eingängen und/oder einem 
oder mehreren Ausgängen zum Empfangen und/oder Übertragen von Informationen entspre- 
chen, etwa in digitalen Bitwerten, basierend auf einem Code, innerhalb eines Moduls, zwi- 


schen Modulen, oder zwischen Modulen verschiedener Entitäten. 


Beispielsweise können die ein oder mehreren Prozessoren 24 einem beliebigen Controller 
oder Prozessor oder einer programmierbaren Hardwarekomponente entsprechen. Beispiels- 
weise kann die Funktionalität der ein oder mehreren Prozessoren 24 auch als Software reali- 
siert sein, die für eine entsprechende Hardwarekomponente programmiert ist. Insofern kön- 
nen die ein oder mehreren Prozessoren 24 als programmierbare Hardware mit entsprechend 
angepasster Software implementiert sein. Dabei können beliebige Prozessoren, wie Digitale 
Signalprozessoren (DSPs) zum Einsatz kommen. Ausführungsbeispiele sind dabei nicht auf 
einen bestimmten Typ von Prozessor eingeschränkt. Es sind beliebige Prozessoren oder auch 


mehrere Prozessoren zur Implementierung denkbar. 


Die ein oder mehreren Speichergeräte 26 können beispielsweise zumindest ein Element der 
Gruppe von computerlesbares Speichermedium, magnetisches Speichermedium, optisches 
Speichermedium, Festplatte, Flash-Speicher, Diskette, Zufallszugriffsspeicher (auch engl. 
Random Access Memory), Programmable Read Only Memory (PROM), Erasable Program- 
mable Read Only Memory (EPROM), Electronically Erasable Programmable Read Only 
Memory (EEPROM), und Netzwerkspeicher umfassen. 


Neben der Generierung der Trainingsdaten und dem Training des Maschinenlern-Modell ist 
ein weiterer Aspekt der vorliegenden Offenbarung der Einsatz des Maschinenlern-Modells 


zur Vorhersage des Zustands eines technischen Bauteils. Die folgende Beschreibung bezieht 
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sich auf ein Verfahren, eine Vorrichtung und ein entsprechendes Computerprogramm, sowie 
auf ein System. Merkmale, die im Zusammenhang des Verfahrens eingeführt werden, können 
daher auch in die entsprechende Vorrichtung, das Computerprogramm und das System über- 


nommen werden (und umgekehrt). 


Fig. 3a zeigt ein Flussdiagramm eines Beispiels eines computer-implementierten Verfahrens 
zum Vorhersagen eines Zustands eines technischen Bauteils. Das Verfahren umfasst ein Er- 
halten 310 eines Messdatensatzes über das technische Bauteil 40 (gezeigt in Fig. 3b), etwa 
von ein oder mehreren Sensoren 42, die Eingabe-Messdaten und/oder Ausgabe-Messdaten 
über das technische Bauteil erzeugen. Das Verfahren umfasst ferner ein Bereitstellen 320 von 
Messdaten des Messdatensatzes für das Maschinenlern-Modell. Das Maschinenlern-Modell 
gemäß dem Verfahren, der Vorrichtung und dem Computer-Programm von Fign. 2a bis 2f 
trainiert. Das Verfahren umfasst ferner ein Vorhersagen 330 des Zustands des technischen 
Bauteils basierend auf einer Ausgabe des Maschinenlern-Modells. Optional umfasst das Ver- 
fahren ferner ein Ausgeben 340 eines Signals über den vorhergesagten Zustand. Beispiels- 
weise kann das Signal je nach Zustand (Normalzustand, abnormaler Zustand, Vor-Fehlerzu- 
stand, Fehlerzustand) einen anderen Wert annehmen oder entsprechende kodierte Informati- 


onen enthalten. 


Fig. 3bzeigt ein Blockdiagramm eines Beispiels einer computer-implementierten Vorrich- 
tung zum Vorhersagen eines Zustands eines technischen Bauteils und eines Systems. Die 
Vorrichtung 30 umfasst ein oder mehreren Prozessoren 34 und ein oder mehreren Speicher- 
einrichtungen 36. Optional umfasst die Vorrichtung 30 ferner eine Schnittstelle 32. Die Vor- 
richtung 30 ist ausgebildet zum Durchführen zumindest des Verfahrens von Fig. 3a. Optional 
kann die Vorrichtung 30 ferner ausgebildet sein, um das Verfahren von Fig. la und/oder das 
Verfahren von Fig. 2a auszuführen. Dabei wird die Funktionalität der Vorrichtung 30 von den 
ein oder mehreren Prozessoren 34 der Vorrichtung bereitgestellt, unter Zuhilfenahme der op- 
tionalen Schnittstelle 32 (etwa zum Erhalten des Messdatensatzes und zur Ausgabe Signals 
über den vorhergesagten Zustand) und der ein oder mehreren Speichereinrichtungen (etwa 
zum Speichern des Maschinenlern-Modells). Beispielsweise kann die computerimplemen- 
tierte Vorrichtung 30 ausgebildet sein, um den Zustand des technischen Bauteils 40 vorher- 


zugsagen. 
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Fig. 3b zeigt ferner ein System umfassend die Vorrichtung 30 und das technische Bauteil 40. 
Optional kann das System ferner die ein oder mehreren Sensoren 42 umfassen. Beispielsweise 
können die ein oder mehreren Sensoren einen oder mehrere Sensoren der Gruppe von einen 
Stromsensor, einen Spannungssensor, einen Audio-Sensor, einen Vibrations-Sensor, eine Ka- 
mera (etwa eine Wärmebildkamera), ein Temperatursensor, einen Wettersensor, einen Dreh- 
zahlsensor, und einen Kraftsensor umfassen. Entsprechen kann auch der Messdatensatz ein 
oder mehrere von Messdaten eines Stromsensors, Messdaten eines Spannungssensors, Mess- 
daten eines Audio-Sensors (etwa eines Analog-Digital-Wandlers, der ein Mikrofonsignal 
wandelt), Messdaten eines Vibrations-Sensors, Messdaten (etwa Bilddaten) einer Kamera 
(etwa einer Wärmebildkamera), Messdaten eines Temperatursensors, Messdaten eines Wet- 
tersensors, Messdaten eines Drehzahlsensors und Messdaten eines Kraftsensors umfassen. 
Beispielsweise können die Messdaten ähnlich implementiert sein, wie die Messdaten, die in 
Zusammenhang mit den Fign. la bis 1f eingeführt werden. Insbesondere können die Messda- 


ten auch vorverarbeiteten Daten entsprechen und/oder extrahierten Merkmalen entsprechen. 


Im Zusammenhang mit den Fign. la bis If wurde bereits darauf hingewiesen, dass das vor- 
geschlagene Konzept insbesondere auch für technische Bauteile von Energieanlagen genutzt 
werden kann. Insbesondere kann das Maschinenlern-Modell, und damit das Verfahren, die 
Vorrichtung, das Computerprogramm und das System beispielsweise bei einem Transforma- 
tor zur Detektion und/oder Klassifizierung von Veränderungen am Aktivteil, zur Detektion 
und/oder zur Klassifizierung von Teilentladungen, und/oder zur Detektion und/oder Klassifi- 


zierung von Temperaturveränderungen verwendet werden. 


Das Maschinenlern-Modell, und damit das Verfahren, die Vorrichtung, das Computerpro- 
gramm und das System kann beispielsweise bei Laststufenschaltern zur Detektion und/oder 
Klassifizierung von Abnutzung, Schäden oder Fehlern der beweglichen Komponenten, zur 
Detektion und/oder Klassifizierung von Schäden oder Fehlern an elektrischen Komponenten, 
und/oder zur Detektion und/oder Klassifizierung nicht korrekt ausgeführter Schalthandlungen 


genutzt werden. 


Das Maschinenlern-Modell, und damit das Verfahren, die Vorrichtung, das Computerpro- 
gramm und das System kann beispielsweise bei Leistungsschaltern, Trennschaltern oder Last- 
trennschalter zur Detektion und/oder Klassifizierung von Abnutzung, Schäden oder Fehlern 


der beweglichen Komponenten, zur Detektion und/oder Klassifizierung von Schäden oder 
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Fehlern an elektrischen Komponenten, zur Detektion und/oder Klassifizierung nicht korrekt 
ausgeführter Schalthandlungen, zur Detektion und/oder Klassifizierung von Leckage, Lecka- 
gegrads oder Leckageorts von Füllgasen oder Füllflüssigkeiten und/oder zur Bestimmung, 


Detektion und/oder Klassifizierung des Düsenabbrands genutzt werden. 


Das Maschinenlern-Modell, und damit das Verfahren, die Vorrichtung, das Computerpro- 
gramm und das System kann beispielsweise bei Schaltanlagen zur Detektion und/oder Klas- 
sifizierung von Abnutzung, Schäden oder Fehlern der beweglichen Komponenten, zur Detek- 
tion und/oder Klassifizierung von Schäden oder Fehlern an elektrischen Komponenten, zur 
Detektion und/oder Klassifizierung von Leckage, Leckagegrads oder Leckageorts von Füll- 
gasen oder Füllflüssigkeiten und/oder zur Detektion und/oder Klassifizierung von Tempera- 


turveränderungen genutzt werden. 


Das Maschinenlern-Modell, und damit das Verfahren, die Vorrichtung, das Computerpro- 
gramm und das System kann bei Kabeln und Muffen zur Detektion und/oder Klassifizierung 
von Teilentladungen, zur Detektion und/oder Klassifizierung der Änderung des Verlustfak- 
tors, zur Detektion und/oder Klassifizierung von Wassereindringen, zur Detektion und/oder 
Klassifizierung von Raumladungsbildung, und/oder zur Detektion und/oder Klassifizierung 


von Temperaturveränderungen verwendet werden. 


Das Maschinenlern-Modell, und damit das Verfahren, die Vorrichtung, das Computerpro- 
gramm und das System kann beispielsweise bei Hochspannungsdurchführungen zur Detek- 
tion und/oder Klassifizierung von Teilentladungen, zur Detektion und/oder Klassifizierung 
der Änderung des Verlustfaktors, zur Detektion und/oder Klassifizierung der Änderung der 
Kapazität und/oder zur Detektion und/oder Klassifizierung von Temperaturveränderungen 


verwendet werden. 


Das Maschinenlern-Modell, und damit das Verfahren, die Vorrichtung, das Computerpro- 
gramm und das System kann beispielsweise bei Freileitungen oder Freileitungsarmaturen zur 
Detektion und/oder Klassifizierung von Teilentladungen, zur Detektion und/oder Klassifizie- 
rung der Änderung des Verlustfaktors, und/oder zur Detektion und/oder Klassifizierung von 


Temperaturveränderungen verwendet werden. 
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Die modellbasierte Datenvermehrung ermöglicht Diagnosesysteme für die beschriebenen An- 
wendungsmöglichkeiten, unter anderem, zu erstellen, die höhere Erfolgsgrade bei der Diag- 
nose erzielen als Diagnosesysteme, die ohne die modellbasierte Datenvermehrung erstellt 


werden. 


Die Schnittstelle 32 kann beispielsweise einem oder mehreren Eingängen und/oder einem 
oder mehreren Ausgängen zum Empfangen und/oder Übertragen von Informationen entspre- 
chen, etwa in digitalen Bitwerten, basierend auf einem Code, innerhalb eines Moduls, zwi- 


schen Modulen, oder zwischen Modulen verschiedener Entitäten. 


Beispielsweise können die ein oder mehreren Prozessoren 34 einem beliebigen Controller 
oder Prozessor oder einer programmierbaren Hardwarekomponente entsprechen. Beispiels- 
weise kann die Funktionalität der ein oder mehreren Prozessoren 34 auch als Software reali- 
siert sein, die für eine entsprechende Hardwarekomponente programmiert ist. Insofern kön- 
nen die ein oder mehreren Prozessoren 34 als programmierbare Hardware mit entsprechend 
angepasster Software implementiert sein. Dabei können beliebige Prozessoren, wie Digitale 
Signalprozessoren (DSPs) zum Einsatz kommen. Ausführungsbeispiele sind dabei nicht auf 
einen bestimmten Typ von Prozessor eingeschränkt. Es sind beliebige Prozessoren oder auch 


mehrere Prozessoren zur Implementierung denkbar. 


Die ein oder mehreren Speichergeräte 36 können beispielsweise zumindest ein Element der 
Gruppe von computerlesbares Speichermedium, magnetisches Speichermedium, optisches 
Speichermedium, Festplatte, Flash-Speicher, Diskette, Zufallszugriffsspeicher (auch engl. 
Random Access Memory), Programmable Read Only Memory (PROM), Erasable Program- 
mable Read Only Memory (EPROM), Electronically Erasable Programmable Read Only 
Memory (EEPROM), und Netzwerkspeicher umfassen. 


Mehr Details und Aspekte des Verfahrens, der Vorrichtung, des Systems und des Computer- 
programms werden in Verbindung mit dem Konzept oder Beispielen genannt, die vorher (z.B. 
Fig. la bis 2g) beschrieben wurden. Das Verfahren, die Vorrichtung, das System und das 
Computerprogramm kann ein oder mehrere zusätzliche optionale Merkmale umfassen, die 
ein oder mehreren Aspekten des vorgeschlagenen Konzepts oder der beschriebenen Beispiele 


entsprechen, wie sie vorher oder nachher beschrieben wurden. 
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Die Aspekte und Merkmale, die im Zusammenhang mit einem bestimmten der vorherigen 
Beispiele beschrieben sind, können auch mit einem oder mehreren der weiteren Beispiele 
kombiniert werden, um ein identisches oder ähnliches Merkmal dieses weiteren Beispiels zu 


ersetzen oder um das Merkmal in das weitere Beispiel zusätzlich einzuführen. 


Beispiele können weiterhin ein (Computer-)Programm mit einem Programmcode zum Aus- 
führen eines oder mehrerer der obigen Verfahren sein oder sich darauf beziehen, wenn das 
Programm auf einem Computer, einem Prozessor oder einer sonstigen programmierbaren 
Hardwarekomponente ausgeführt wird. Schritte, Operationen oder Prozesse von verschiede- 
nen der oben beschriebenen Verfahren können also auch durch programmierte Computer, 
Prozessoren oder sonstige programmierbare Hardwarekomponenten ausgeführt werden. Bei- 
spiele können auch Programmspeichervorrichtungen, z. B. Digitaldatenspeichermedien, ab- 
decken, die maschinen-, prozessor- oder computerlesbar sind und maschinenausführbare, pro- 
zessorausführbare oder computerausführbare Programme und Anweisungen codieren bezie- 
hungsweise enthalten. Die Programmspeichervorrichtungen können z.B. Digitalspeicher, 
magnetische Speichermedien wie beispielsweise Magnetplatten und Magnetbänder, Festplat- 
tenlaufwerke oder optisch lesbare Digitaldatenspeichermedien umfassen oder sein. Weitere 
Beispiele können auch Computer, Prozessoren, Steuereinheiten, (feld-)programmierbare Lo- 
gik-Arrays ((F)PLAs = (Field) Programmable Logic Arrays),(feld-)programmierbare Gate- 
Arrays ((F)PGA = (Field) Programmable Gate Arrays), Grafikprozessoren (GPU = Graphics 
Processor Unit), anwendungsspezifische integrierte Schaltungen (ASIC = application-spe- 
cific integrated circuit), integrierte Schaltungen (IC= Integrated Circuit) oder Ein-Chip-Sys- 
teme (SoC = System-on-a-Chip) abdecken, die zum Ausführen der Schritte der oben beschrie- 


benen Verfahren programmiert sind. 


Verschiedene Ausführungsbeispiele schaffen ferner ein Computerprogrammprodukt, umfas- 
send Befehle, die bei der Ausführung des Programms durch einen Computer diesen veranlas- 


sen, zumindest eines der Verfahren gemäß einem der vorliegenden Ansprüche auszuführen. 


Verschiedene Ausführungsbeispiele schaffen ferner ein Computerlesbares (Speicher)me- 
dium, umfassend Befehle, die bei der Ausführung durch einen Computer diesen veranlassen, 


zumindest eines der Verfahren gemäß einem der vorliegenden Ansprüche auszuführen. 
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Es versteht sich ferner, dass die Offenbarung mehrerer, in der Beschreibung oder den Ansprü- 
chen offenbarter Schritte, Prozesse, Operationen oder Funktionen nicht als zwingend in der 
beschriebenen Reihenfolge befindlich ausgelegt werden soll, sofern dies nicht im Einzelfall 
explizit angegeben oder aus technischen Gründen zwingend erforderlich ist. Daher wird durch 
die vorhergehende Beschreibung die Durchführung von mehreren Schritten oder Funktionen 
nicht auf eine bestimmte Reihenfolge begrenzt. Ferner kann bei weiteren Beispielen ein ein- 
zelner Schritt, eine einzelne Funktion, ein einzelner Prozess oder eine einzelne Operation 
mehrere Teilschritte, -funktionen, -prozesse oder -operationen einschließen und/oder in die- 


selben aufgebrochen werden. 


Wenn einige Aspekte in den vorhergehenden Abschnitten im Zusammenhang mit einer Vor- 
richtung oder einem System beschrieben wurden, sind diese Aspekte auch als eine Beschrei- 
bung des entsprechenden Verfahrens zu verstehen. Dabei kann beispielsweise ein Block, eine 
Vorrichtung oder ein funktionaler Aspekt der Vorrichtung oder des Systems einem Merkmal, 
etwa einem Verfahrensschritt, des entsprechenden Verfahrens entsprechen. Entsprechend 
dazu sind Aspekte, die im Zusammenhang mit einem Verfahren beschrieben werden, auch als 
eine Beschreibung eines entsprechenden Blocks, eines entsprechenden Elements, einer Ei- 
genschaft oder eines funktionalen Merkmals einer entsprechenden Vorrichtung oder eines 


entsprechenden Systems zu verstehen. 


Die folgenden Ansprüche werden hiermit in die detaillierte Beschreibung aufgenommen, wo- 
bei jeder Anspruch als getrenntes Beispiel für sich stehen kann. Ferner ist zu beachten, dass 
— obwohl ein abhängiger Anspruch sich in den Ansprüchen auf eine bestimmte Kombination 
mit einem oder mehreren anderen Ansprüchen bezieht — andere Beispiele auch eine Kombi- 
nation des abhängigen Anspruchs mit dem Gegenstand jedes anderen abhängigen oder unab- 
hängigen Anspruchs umfassen können. Solche Kombinationen werden hiermit explizit vor- 
geschlagen, sofern nicht im Einzelfall angegeben ist, dass eine bestimmte Kombination nicht 
beabsichtigt ist. Ferner sollen auch Merkmale eines Anspruchs für jeden anderen unabhängi- 
gen Anspruch eingeschlossen sein, selbst wenn dieser Anspruch nicht direkt als abhängig von 


diesem anderen unabhängigen Anspruch definiert ist. 
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1. 


BB 


3. 


Patentansprüche 


Ein computer-implementiertes Verfahren zum Erzeugen von Trainingsdatensätzen 
zum Trainieren eines Maschinenlern-Modells zur Vorhersage über einen Zustand ei- 


nes technischen Bauteils, das Verfahren umfassend: 


Erhalten (110) einer Mehrzahl von Messdatensätzen über das technische Bauteil, wo- 


bei jeder Messdatensatz zumindest ein oder mehrere Ausgangs-Messdaten umfasst; 


Ermitteln (120) von Modell-Parameterwerten von ein oder mehreren Modell-Parame- 
tern eines physikalischen Modells des technischen Bauteils basierend auf den ein oder 


mehreren Ausgangs-Messdaten der jeweiligen Messdatensätze; 


Bestimmen (140) einer ersten Mehrzahl von Trainingsdatensätzen; 


Durchführen (150) einer zweiten Mehrzahl von Simulationen des physikalischen Mo- 
dells, um eine zweite Mehrzahl von Trainingsdatensätzen zu generieren, wobei basie- 
rend auf einer statistischen Verteilung der ermittelten Modell-Parameterwerte ein oder 
mehrere Modell-Parameterwerte für die jeweilige Simulation ausgewählt werden, wo- 
bei für jede Simulation zumindest ein Modell-Parameterwert außerhalb eines Haupt- 
bereichs der statistischen Verteilung der ermittelten Modell-Parameterwerte ausge- 


wählt wird. 


Das Verfahren gemäß Anspruch 1, umfassend Durchführen einer ersten Mehrzahl von 
Simulationen des physikalischen Modells, um die erste Mehrzahl von Trainingsdaten- 
sätzen zu generieren, wobei basierend auf der statistischen Verteilung der ermittelten 
Modell-Parameterwerte ein oder mehrere Modell-Parameterwerte für die jeweilige Si- 


mulation ausgewählt werden. 


Das Verfahren gemäß einem der Ansprüche 1 oder 2, wobei die erste Mehrzahl von 
Trainingsdatensätzen einen Normalzustand des technischen Bauteils abbilden und 
wobei die zweite Mehrzahl von Trainingsdatensätzen einen oder mehrere abnormale 


Zustände des technischen Bauteils abbilden. 
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4. 


9: 


6. 


T: 


8. 


Das Verfahren gemäß Anspruch 3, wobei das physikalische Modell dazu geeignet ist, 
um eine Simulation des Normalzustands und eine Simulation der ein oder mehreren 


abnormalen Zustände des Bauteils durchzuführen. 


Das Verfahren gemäß einem der Ansprüche 1 bis 4, wobei die Mehrzahl von Messda- 
tensätzen ferner ein oder mehrere Eingangs-Messdaten umfasst, wobei die Modell- 
Parameterwerte des physikalischen Modells ferner basierend auf den ein oder mehre- 
ren Eingangs-Messdaten ermittelt werden, wobei für die Simulationen des physikali- 
schen Modells ferner basierend auf einer statistischen Verteilung der Eingangs-Mess- 


daten ein oder mehrere Eingangs-Daten ausgewählt werden. 


Das Verfahren gemäß einem der Ansprüche 1 bis 5, umfassend Bestimmen (122) der 
statistischen Verteilung der ermittelten Modell-Parameterwerte des physikalischen 
Modells, durch Unterteilen (124) der Mehrzahl von Messdatensätzen in eine Mehrzahl 
von Gruppen von Messdatensätzen, Ermitteln (120), für jede Gruppe von Messdaten- 
sätzen, von ein oder mehreren Modell-Parameterwerten des physikalischen Modells 
durch Minimierung eines Fehlers zwischen den ein oder mehreren Ausgangs-Mess- 
daten der jeweiligen Gruppe von Messdatensätzen und entsprechenden mittels des 
physikalischen Modells erzeugten Ausgangsdaten, und Berechnen (126) der statisti- 
schen Verteilung der basierend auf den verschiedenen Gruppen von Messdatensätzen 


ermittelten Modell-Parameterwerten. 


Das Verfahren gemäß einem der Ansprüche 1 bis 6, wobei für jede Simulation der 
zweiten Mehrzahl von Simulationen ein Modell-Parameterwert außerhalb des Haupt- 
bereichs der statistischen Verteilung der ermittelten Modell-Parameterwerte und an- 
dere Modell-Parameterwerte, sofern vorhanden, basierend auf der statistischen Ver- 


teilung der ermittelten Modell-Parameterwerte ausgewählt werden. 


Das Verfahren gemäß einem der Ansprüche 1 bis 7, wobei für zumindest eine Simu- 
lation der zweiten Mehrzahl von Simulationen zumindest zwei Modell-Parameter- 
werte außerhalb des Hauptbereichs der statistischen Verteilung der jeweiligen Modell- 
Parameterwerte ausgewählt werden, wobei die zumindest zwei Modell-Parameter- 
werte basierend auf einem vorbekannten Zusammenhang zwischen den zwei Modell- 


Parametern ausgewählt werden. 
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9. Das Verfahren gemäß einem der Ansprüche 1 bis 8, wobei das physikalische Modell 


dazu vorgesehen ist, um durch Durchführen einer Simulation basierend auf zumindest 
ein oder mehreren Modell-Parameterwerten ein oder mehrere Ausgangsdaten zu er- 


zeugen. 


10. Das Verfahren gemäß einem der Ansprüche 1 bis 9, wobei das technische Bauteil eine 


Komponente einer Maschine oder einer technischen Anlage ist, 

und/oder wobei das technische Bauteil ein elektrotechnisches Bauteil ist, 

und/oder wobei das technische Bauteil eines von einem Transformator, einem Last- 
stufenschalter, einem Leistungsschalter, einem Trennschalter, einem Lasttrennschal- 
ter, einer Schaltanlage, einem Kabel, einer Muffe, einer Freileitung, einer Freilei- 


tungsarmatur und einer Hochspannungsdurchführung ist. 


11. Ein computer-implementiertes Verfahren zum Trainieren eines Maschinenlern-Mo- 


dells zur Vorhersage eines Zustands eines technischen Bauteils, das Verfahren umfas- 


send: 


Erhalten (210) einer ersten Mehrzahl von Trainingsdatensätzen und einer zweiten 
Mehrzahl von Trainingsdatensätzen, wobei die erste Mehrzahl von Trainingsdatensät- 
zen und die zweite Mehrzahl von Trainingsdatensätzen basierend auf dem Verfahren 
gemäß einem der Ansprüche 1 bis 10 erzeugt sind, wobei die erste Mehrzahl von Trai- 
ningsdatensätzen einen Normalzustand des technischen Bauteils abbilden und wobei 
die zweite Mehrzahl von Trainingsdatensätzen einen oder mehrere abnormale Zu- 


stände des technischen Bauteils abbilden; 


Trainieren (230) des Maschinenlern-Modells basierend auf der ersten Mehrzahl von 
Trainingsdatensätzen und basierend auf der zweiten Mehrzahl von Trainingsdatensät- 


zen. 


12. Das Verfahren gemäß Anspruch 11, ferner umfassend Erhalten (220) einer Mehrzahl 


von Messdatensätzen über das technische Bauteil, wobei das Training des Maschinen- 


lern-Modells ferner auf der Mehrzahl von Messdatensätzen basiert. 
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13. Das Verfahren gemäß Anspruch 12, wobei die Mehrzahl von Messdatensätzen um die 
erste und zweite Mehrzahl von Trainingsdatensätzen erweitert werden und das Ma- 
schinenlern-Modell gemeinsam basierend auf der Mehrzahl von Messdatensätzen und 


der ersten und zweiten Mehrzahl von Trainingsdatensätzen trainiert wird. 


14. Das Verfahren gemäß Anspruch 12, wobei das Maschinenlern-Modell in einem ersten 
Schritt basierend auf der ersten und zweiten Mehrzahl von Trainingsdatensätzen trai- 
niert wird, und wobei das Training des Maschinenlern-Modells in einem zweiten 
Schritt mittels Transfer Learning basierend auf der Mehrzahl von Messdatensätzen 


fortgeführt wird. 


15. Das Verfahren gemäß einem der Ansprüche 11 bis 14, wobei das Maschinenlern-Mo- 


dell als Klassifikator für den Zustand des technischen Bauteils trainiert wird. 


16. Ein computer-implementiertes Verfahren zum Vorhersagen eines Zustands eines tech- 


nischen Bauteils, das Verfahren umfassend: 


Erhalten (310) eines Messdatensatzes über das technische Bauteil; 


Bereitstellen (320) von Messdaten des Messdatensatzes für ein Maschinenlern-Mo- 
dell, wobei das Maschinenlern-Modell gemäß einem der Ansprüche 11 bis 15 trainiert 


ist; und 


Vorhersagen (330) des Zustands des technischen Bauteils basierend auf einer Ausgabe 


des Maschinenlern-Modells. 


17. Ein System (300) umfassend ein technisches Bauteil (40) und eine computerimple- 
mentierte Vorrichtung (30), wobei die computerimplementierte Vorrichtung ein oder 
mehrere Prozessoren (34) und ein oder mehreren Speichereinrichtungen (36) umfasst 
und ausgebildet ist zum Ausführen des Verfahrens von Anspruch 16, wobei die com- 
puterimplementierte Vorrichtung ausgebildet ist, um den Zustand des technischen 


Bauteils vorherzugsagen. 
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18. Ein Programm mit einem Programmcode zum Durchführen zumindest eines der Ver- 
fahren gemäß einem der Ansprüche 1 bis 16, wenn der Programmcode auf einem 
Computer, einem Prozessor, einem Kontrollmodul oder einer programmierbaren 


Hardwarekomponente ausgeführt wird. 


19. Eine computerimplementierte Vorrichtung (10; 20; 30) mit ein oder mehreren Prozes- 
soren (14; 24; 34) und ein oder mehreren Speichereinrichtungen (16; 26; 36), ausge- 


bildet zum Durchführen zumindest eines der Verfahren gemäß einem der Ansprüche 
1 bis 16. 
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Zusammenfassung 


Konzept für eine Datenvermehrung von Trainingsdatensätzen für ein Maschinenlern- 


Modell zur Vorhersage eines Zustands eines technischen Bauteils 


Die vorliegende Erfindung bezieht sich auf Verfahren, Vorrichtungen und Computerprogram- 
men zum Erzeugen von Trainingsdatensätzen zum Trainieren eines Maschinenlern-Modells 
zur Vorhersage über einen Zustand eines technischen Bauteils, zum Trainieren eines solchen 
Maschinenlern-Modells, und zum Einsatz eines solchen Maschinenlern-Modells. Das Ver- 
fahren zum Erzeugen der Trainingsdatensätzen umfasst ein Erhalten (110) einer Mehrzahl 
von Messdatensätzen über das technische Bauteil, wobei jeder Messdatensatz zumindest ein 
oder mehrere Ausgangs-Messdaten umfasst. Das Verfahren umfasst ferner ein Ermitteln 
(120) von Modell-Parameterwerten von ein oder mehreren Modell-Parametern eines physi- 
kalischen Modells des technischen Bauteils basierend auf den ein oder mehreren Ausgangs- 
Messdaten der jeweiligen Messdatensätze. Das Verfahren umfasst ferner ein Bestimmen 
(140) einer ersten Mehrzahl von Trainingsdatensätzen, etwa durch Durchführen einer ersten 
Mehrzahl von Simulationen des physikalischen Modells, wobei basierend auf einer statisti- 
schen Verteilung der ermittelten Modell-Parameterwerte ein oder mehrere Modell-Parame- 
terwerte für die jeweilige Simulation ausgewählt werden. Das Verfahren umfasst ferner ein 
Durchführen (150) einer zweiten Mehrzahl von Simulationen des physikalischen Modells, um 
eine zweite Mehrzahl von Trainingsdatensätzen zu generieren, wobei basierend auf der sta- 
tistischen Verteilung der ermittelten Modell-Parameterwerte ein oder mehrere Modell-Para- 
meterwerte für die jeweilige Simulation ausgewählt werden, wobei für jede Simulation zu- 
mindest ein Modell-Parameterwert außerhalb eines Hauptbereichs der statistischen Vertei- 


lung der ermittelten Modell-Parameterwerte ausgewählt wird. 


(Fig. 1a) 
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